
한국전자통신연구원(ETRI)은 단 한 장의 인물 사진만으로 실제 사람처럼 자연스럽게 말하는 초실사 AI 아바타 생성 기술을 개발했다고 15일 밝혔다.
ETRI에 따르면 이번 기술은 완전 자율주행 시대를 대비해 차량과 사람 간의 직관적인 상호작용을 가능하게 하는 차세대 인터페이스로 주목받고 있으며, 향후 디지털 휴먼 산업 전반으로의 확산도 기대된다.
기존 음성 기반의 AI 비서나 내비게이션 시스템이 단순한 명령 수행에 그쳤다면, ETRI의 초실사 AI 아바타는 정교한 표정과 입 모양 표현을 통해 실제 사람과 같은 자연스러운 대화가 가능하다.
이를 통해 차량 내 AI 운전기사가 운전자와 대화하거나 보행자와 소통하는 등, 보다 인간 친화적인 사용자 경험을 제공할 수 있다.
이번 기술의 핵심은 기존 생성형 AI와 달리, 입술, 턱 등 발화와 직접 연관된 부위를 선별적으로 학습·합성하는 독자 알고리즘이다. 이 방식을 통해 불필요한 정보 학습을 줄이는 한편, 입 모양, 치아, 피부 주름 등 세밀한 얼굴 표현을 더욱 정교하게 구현할 수 있게 됐다.
자율주행차 외에도 △키오스크 △은행 창구 △뉴스 진행 △광고 모델 등 다양한 산업 분야에서 활용될 수 있으며, 인공지능 기반 디지털 휴먼 산업의 혁신을 견인할 것으로 기대된다.
연구책임자인 최대웅 선임연구원은"AI 아바타가 실제 사람처럼 자연스럽게 대화하고 움직이는 생성형 AI 기술을 한층 고도화할 계획"이라며 "향후 주문, 상담 등 일부 인력을 대체할 수 있을 정도의 상호작용 구현을 목표로 하고 있다"고 말했다.