최근 음성인식 기술이 좋아지면서 대화나 회의 내용을 음석 인식을 활용해 회의록으로 작성하는 사례가 늘고 있다. 그러나 민감한 개인정보나 숫자 등이 포함된 경우 보안성과 정확성 문제로 활용에 걸림돌이 되어왔다.
주식회사 마인즈랩(대표 유태준)은 이러한 단점을 보완산 자사 이동형 상담(회의) 녹취 시스템인 ‘마음상담록’을 전국 50 여 국가지자체에 납품했다고 28일 밝혔다.

마인즈랩이 개발한 CNN 알고리즘 기반 엔진을 기반의 ‘마음상담록’은 상용 음성인식 서비스 중 가장 빠르다는 평가다. 또 음성 인식에 취약한 사투리 및 외래어 인식도 높다.
금번에 국가 지자체에 제공된 모델은 특히 아동학대상담 전용 모델로 뛰어난 인식 결과물을 보였다. 전문 데이터 사이언티스트의 다년간의 경험과 노하우가 반영된 완성된 고성능 '제너럴(General) 음성인식 모델 베이스'를 적용한 결과라는 자체 분석이다.
‘마음상담록’은 기존의 클라우드로 제공되는 음성인식 서비스처럼 외부 네트워크 망을 사용하지 않아 강력한 보안 상태를 유지하는 것이 가능하다.

서비스 제공 방식은 상담사의 판단과 상담 환경에 따라 두 가지 중 선택할 수 있다. 우선 ‘실시간 상담 기록’ 방식은 ‘스마트 마이크’를 통해 실시간으로 발화되는 음성을 바로 인식하여 문자로 변환하고, 자동으로 화자를 분리하여 상담록을 작성할 수 있는 방법이다. ‘세컨드 스크린’ 기능으로 표시되는 '실시간 음성인식 결과(TEXT)'는 상담자의 말을 문자로 확인하는 기능으로 상담이 좀더 원활하게 진행되도록 지원한다.
또 상담 내용을 녹음하여 진행하는 ‘음성 녹음 업로드 상담 기록’ 은 상담 환경에서 추가 설치없이 PC, 노트북, 태블릿, 스마트폰 등에서 바로 시스템에 접속하고 녹음 파일을 업로드하여 상담록을 작성할 수 있다.
'마음상담록'은 1시간 분량의 상담 자료를 처리 시간을 약 3분 이내로 줄였다. 기존 DNN, LSTM 음성인식 엔진은 이 과정이 20~30분 정도 소요됐었다. 최근 특허를 획득한 화자 표지 텍스트 생성 기술은 상담사가 텍스트 별 발화자를 쉽게 기록할 수 있는 편집 시스템을 제공하여 상담사와 상담자가 상담 내용에 집중하게 지원한다.
마인즈랩 원정상 전무는 “음성인식 기술은 마인즈랩이 가장 자신있고 잘하는 분야로 어떠한 상황에서도 고품질의 상담 기록물을 만들어 내기 위해 끊임없는 연구개발을 진행하고 있다”며, “’마음 상담록’은 한번의 납품으로 끝나지 않고 지속적인 음성인식 모델 업그레이드와 무상 SW 업데이트를 지원하고 있으며, 앞으로도 고객 만족에 최선을 다하겠다”고 말했다.
