몰입형 콘텐츠 시장이 확장되면서 시각 기술과 함께 오디오 기술도 중요해지고 있다. 특히 메타버스와 VR 콘텐츠에서 소리의 방향성뿐 아니라 거리와 지연을 정밀하게 반영한 3D 오디오 구현이 사용자 몰입도를 결정짓는다. 이와 같은 상황에서 청각적 시간지연을 구현하는 기술의 중요성이 빠르게 대두되고 있다.
한국전자통신연구원(ETRI)이 독자적으로 개발한 실감형 오디오 기술 ‘음원 위치 지연 기술’이 국제표준화기구 MPEG의 몰입형 오디오 국제표준 ‘MPEG-I immersive audio’ 표준 최종안에 지난 4월 공식 반영됐다고 6일 밝혔다.
이는 ETRI 오디오 기술이 국제표준으로 채택됐음을 의미한다. ETRI 연구진은 표준문서 작성은 물론, SW개발에 직접 참여했으며, 음원의 거리에 따른 지연위치 보상방법 및 장치 등 총 12건의 국제표준특허가 채택됐다.
실제 거리·시간 감각 반영한 ‘음원 위치 지연’ 기술
음원 위치 지연 기술은 전투기처럼 빠르게 이동하거나 천둥과 번개처럼 먼 거리에서 발생한 소리가 실제로 보이는 위치보다 약간 지연돼 들리는 현상을 실제와 같이 구현하는 기술이다.

현실 세계에서는 소리의 발생 시점과 청취 시점간 시간차, 즉 청각적 시간차가 자연스럽게 인지되지만, 기존의 가상 오디오 기술에서는 청각적 시간 지연 요소가 반영되지 않아 현실감 및 몰입감이 떨어지는 실제 물리현상과 다른 한계가 있었다. 음원 위치 지연 기술은 가상환경에서도 시간 기반의 청각 지각 요소를 구현해 자연스럽고 현실감 있는 3차원 오디오 경험을 제공한다.
MPEG-I 몰입형 오디오는 청취자의 자유로운 이동과 인터랙션이 가능한 6DoF 공간음향 서비스를 위한 몰입형 실감음향 렌더링 기술 및 렌더링에 필요한 메타데이터 부호화에 대한 표준화를 목표로 한다. 음원 위치 지연 기술은 이 표준에 시간 기반 청각 요소를 더해 몰입감을 향상할 수 있다. 이를 통해 VR경험, 훈련, 교육 등과 같이 정밀한 현실 시뮬레이션이 요구되는 분야에 핵심적인 요소로 활용이 가능하다.
이 기술은 향후 사용자 시점 변화에 따라 3차원 공간상 오디오가 실시간 반응하는 차세대 오디오 기술로, 몰입형 가상현실(VR)은 물론 메타버스, 가상회의, 원격교육, 게임, 실감 공연 등 다양한 산업에서 활용될 수 있다.
ETRI는 이번 기술을 바탕으로 ▲동적 입체공간 미디어 획득·생성 및 실시간 콘텐츠 상호작용 기술 개발 ▲저지연·고품질 동시지원 음향 압축 및 국제표준화 등에 주력할 예정이다. 아울러 초실감 양방향 입체 통신의 구현을 위해서 ▲실시간 공간 콘텐츠 생성기술 ▲공간 상호작용 핵심기술 개발 및 실증(PoC)에 매진할 계획이다.
ETRI 이태진 미디어연구본부장은 “그동안 몰입형 오디오 표준은 주로 소리의 방향성과 거리 표현 등 공간적요소에 집중돼 있었으나, 실제 청각 인식에서 중요한 시간 기반 지각 요소는 표준화 논의에서 간과됐었다. 이번 기술 반영은 국제표준 수립의 핵심 요소로 인정받은 성과”라고 말했다.
관련기사
- ETRI-KAIST, ‘측정 보정 없는 양자키분배’ 검증
- ‘50억대 기기에 적용된 ETRI 미디어 기술’...기술료 1천억 돌파
- ETRI, 원격 협업에 ‘가상 악수’ 구현...XR 기반 실감형 상호작용 기술 공개
- 문화유산 디지털 표준화 기술, 아시아 넘어 유럽 확산 본격화
- ETRI, 에지 연산 최적화·확장성 강화하는 ‘AI 반도체 SW 플랫폼’ 공개
- ETRI, 클라우드 기반 AI 연구성과 체험·공유 플랫폼 ‘이프리텍스’ 공개
- ETRI, ‘국가 공공분야 소버린 AI 토론회’ 개최...도메인 특화 AI 전략 공유
- ETRI, AI 안전성·신뢰성 국제표준 주도
- ETRI, 반도체·AI·양자 이끌 차세대 연구리더 8인 선정...26억 지원
- ETRI, 지능형 감시 국제대회 세계 1위로 기술력 입증
- AI 기반 차세대 치안 서비스...유무인 협업으로 국민 안전망 강화
- ETRI, 전고체 전지 상용화 앞당길 고체전해질막 개발
- AI 로봇 지능 주도권 확보 나선다...국가 기술 패권 대응 본격화
