한국전자통신연구원(ETRI)이 단 한 장의 인물 사진만으로 실제 사람처럼 자연스럽게 말하는 초실사 AI 아바타 생성 기술을 개발했다고 15일 밝혔다.

초실사 AI 아바타는 완전 자율주행 시대를 대비해 차량과 사람 간의 직관적인 상호작용이 가능한 차세대 인터페이스로, 단순한 명령 수행에 그쳤던 기존 음성 기반의 AI 비서나 내비게이션과 달리 정교한 표정과 입 모양 표현을 통해 실제 사람과 같은 자연스러운 대화가 가능하다. 

ETRI 연구진이 '실사 인물 발화 영상 생성 프레임워크 기술'로 생성된 영상 결과물을 검증하는 모습
ETRI 연구진이 '실사 인물 발화 영상 생성 프레임워크 기술'로 생성된 영상 결과물을 검증하는 모습

이번 기술의 핵심은 입술, 턱 등 발화와 직접 연관된 부위를 선별적으로 학습·합성하는 독자적인 알고리듬이다. 이는 불필요한 정보 학습을 줄이고 입 모양, 치아, 피부 주름 등 세밀한 얼굴 표현을 더욱 정교하게 구현할 수 있다.

이 기술은 자율주행차 외에도 ▲키오스크 ▲은행 창구 ▲뉴스 진행 ▲광고 모델 등 다양한 산업 분야에서 활용될 수 있으며, AI 기반 디지털 휴먼 산업의 혁신을 견인할 것으로 기대된다.

ETRI는 AI 아바타가 실제 사람처럼 자연스럽게 대화하고 움직이는 생성AI 기술을 고도화해 주문, 상담 등 일부 인력을 대체할 수 있을 정도의 상호작용 구현을 목표로 하고 있다.

ETRI 윤대섭 모빌리티UX연구실장은 “모빌리티 기술이 고도화될수록 노인이나 사회적 약자들이 소외될 수 있다. 이번 AI 아바타 기술이 디지털 리터러시 향상에 기여하고, 모두가 쉽게 이용할 수 있는 스마트 모빌리티 서비스로 발전하길 기대한다.”라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지