음성 발화(發話)는 기억, 의도, 주의집중 등 인지기능과 음운, 통사, 의미 등 언어 생성 기능, 호흡, 조음, 발성 등 구어 운동 기능이 순차적으로 작용하는 복합적인 과정이다.
한국전자통신연구원(ETRI, 원장 방승찬)이 노년층의 음성 발화를 분석해 치매 전 단계인 경도인지장애 및 치매 고위험군을 선별하는 AI 기술을 개발했다고 1일 밝혔다.

기술 개발은 국가과학기술연구회 창의형 융합연구사업인 ‘노년층의 일상생활 발화 빅데이터 구축을 통한 AI기반 퇴행성 뇌기능 저하 평가 기술 개발’ 과제로 진행됐다. 이 기술을 통해 발화 분석을 통해 경도인지장애 및 치매 환자에게서 나타나는 인지, 언어, 운동 능력의 저하를 조기에 판단하고 예측하는 것이 가능하다.
노년층, 특히 경도인지장애 및 치매 고위험군에서 흔히 나타나는 부정확한 발음, 사투리 발화 등으로 인해 분석에 어려움이 있지만 축적된 음성 및 멀티모달 AI 기술을 바탕으로 이를 극복했다.
실제 수요자인 노년층의 사용자 편의성 및 정확도 개선에 주안점을 두고 개발했고, 한국전기연구원과 연계해 노인복지센터 등에서 실증을 계획 중이다.
또한 연구진은 기존의 음성, 텍스트 분석 기술에 LLM을 결합한 알츠하이머 치매 예측 연구를 진행했다. 이 연구는 영국 에든버러 대학과 미국 카네기 멜론 대학에서 주최한 ADReSSo 챌린지 데이터셋에서 기존에 발표된 85.4%을 넘는 87.3%의 최고 성능을 획득했다.
한편, 후속 연구로 시각언어모델(VLM) 기술을 적용해 동일한 ADReSSo 챌린지에서 최고 성능을 갱신했다. 이 연구 결과를 바탕으로, 일상생활 대화 과제를 중심으로 한 음성 발화 입력을 통해 경도인지장애 고위험군을 예측하는 태블릿 기반 앱 개발도 완료했다.
강병옥 ETRI 복합지능연구실 책임연구원은“기존 보건소에 직접 방문해 선별검사를 받는 방식에 비해, 스마트기기를 통한 대화 기반의 검사 방식은 지속적/주기적 모니터링이 가능하다는 장점이 있다.”라고 말했다.
관련기사
- LLM 정확도·처리 속도 높이는 ‘엔비디아 네모 리트리버 NIM’ 마이크로서비스
- ETRI, IoT·스마트시티 국제표준 주도권 확보
- 미소정보기술-시야인사이트, 강원도 바이오헬스 사업 확대 협력
- ETRI, '차세대주역 신진연구사업' 7개 과제 선정...총 21억 지원
- ‘제로지식 생체 인증 솔루션’ 안전성·경제성 높아 핀테크와 금융권이 주목
- 피아이이-ETRI, 3D CT 검사 기술 협력
- ETRI, AI 연구 개발 성과 및 미래 기술 공개
- 흩어진 개인건강기록 통합하는 '생성AI 기반 멀티모달 데이터 플랫폼'
- 의료·산업 초거대AI 효율 높이는 '非라벨링 데이터 솔루션'
- 마이크로소프트가 주목하는 3대 AI 트렌드,"sLLM·멀티모달 AI·과학 혁신"
- 범죄자를 정확히 가려내는 생체 측정 솔루션
- AI로 발전량 예측하는 전력중개 서비스 연계 ‘에너지 저장 시스템’
- ETRI, 충남TP에 디스플레이 공정 기술 전수
- ETRI, ‘폐질환 스크리닝 장치’ 개발...혼자서도 폐질환 검사 가능
- 몽골로 뻗어나가는 ETRI '재난안전 관리 기술'
- 국내 태블릿 출하량 22% 감소...'AI·대화면·분리형 모델'로 극복
- ETRI 'AI 패션 코디네이터 경진대회', 복합 멀티모달 데이터세트 평가
- ETRI, '휴먼이해 인공지능 논문경진대회', 감정 이해 AI 개발 연구 독려
