기존 클라우드 기반 음성 합성은 서버로 텍스트를 전송하고, 생성된 음성을 사용자 기기로 전송함에 따라 시간 지연이 발생하고 인터넷 연결 문제로 인한 불편함이 있었다.

음성기술 전문기업인 셀바스AI가 웹소설 등 전자책을 사람과 비슷한 고품질 보이스로 읽어 주는 AI 음성 합성 제품 ‘셀비 딥TTS 온디바이스(Selvy deepTTS On-Device)’를 공개했다.

셀비 딥TTS 온디바이스는 딥러닝 기반 음성 합성 제품이다. 스마트폰, 노트북, 태블릿 등 개인 디바이스에서 인터넷 연결 없이 AI 기술로 사람의 호흡, 억양, 감성 등 다양한 음성 요소를 정교하게 구현할 수 있도록 모델링했다. 또한 온디바이스에서 동작함에도 고성능의 CPU 또는 GPU를 사용하는 서버 기반 AI 음성 합성 솔루션 수준의 합성 음질을 제공한다. 이를 통해 사람처럼 자연스럽고 유창한 합성 음성음을 생성하여 웹소설, 전자책 등을 읽어 준다.

온디바이스 기술은 사용자 데이터가 외부 서버로 전송되지 않아 개인정보, 지적재산권 등 외부 데이터 유출이 우려되는 콘텐츠에 적합하다. 정부기관이나 금융, 교육 분야 등 정보 보안이 중요한 폐쇄망 환경에서도 고품질 음성 합성 활용이 가능하다.

셀바스AI는 온디바이스 TTS의 강점을 기반으로 모바일 앱 서비스는 물론 웨어러블, 로봇, 차량 등으로 고객을 확대해 나갈 예정이다. 특히 서비스 안정성이 중요한 자율주행 차량, 24시간 서비스가 필요한 키오스크 등 오프라인 환경에서 실시간 음성 합성을 필요로 하는 고객과의 협업도 이어 나갈 계획이다.

셀바스AI 음성 합성 이항섭 사업대표는 “셀바스AI는 개선된 음성 합성 솔루션을 통해 전자책 고객 및 서비스의 요구사항을 적극 반영하고 시장을 빠르게 확대할 계획”이라고 말했다.

 

[알림] GTT KOREA와 전자신문인터넷이 오는 3월 21일 인터컨티넨탈 서울 코엑스에서 공동으로 주최하는 ‘Data Insight & Security Summit(DISS) 2024’에서는 “AI 트랜스포메이션, 데이터 이노베이션”을 주제로 데이터 산업을 이끌고 있는 글로벌 리더들이 AI 기반 데이터 활용과 전략 수립에 난항을 겪고 있는 기업들에게 효과적인 데이터 관리와 인사이트, 강력한 데이터 보안 전략을 제시한다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지