
마인즈랩은 25일 자사 연구팀 차성국 연구원의 논문이 국제 패턴 인식 협회 학술지인 'PRL(Pattern Recognition Letters, impact score 3.756)'에 실린다고 밝혔다. 이번 논문은 시각 엔진 분야로, 마인즈랩 연구진이 다양한 영역에서 연구 성과를 올리고 있다.
마인즈랩의 연구팀은 이미 지난해 음성 분야의 인공 지능 엔진과 관련, 두 차례 논문을 발표했다. 9월 세계 최고 권위의 인공 지능 음성 신호 처리 학회인 ‘INTERSPEECH 2021’과 12월 ‘NeurIPS Workshop on ML for Creativity and Design 2021’에 논문이 실렸다.
PRL은 국제 패턴 인식 협회(International Association for Pattern Recognition)에서 발행하는 학술지로, 최근 이슈가 되고 있는 시각 분야의 인공 지능 관련 논문이 선정된 것은 의미가 크다.
이번 논문은 학습한 적 없는 사물도 인식하는 ‘제로샷 의미 체계 세분화(zero-shot segmentation)’ 연구로, 고가의 라벨링 비용 문제를 해결할 수 있는 접근법을 제안한다.
차성국 연구원은 “본 연구는 Multi-modal(vision+NLP) 개념이 유행하기 전인 2020년에 진행한 것으로, 현재는 Human-Object Interaction(HOI)까지 연구가 진행중”이라고 설명했다.
머신러닝/딥러닝을 이용한 시각 인식은 빅 데이터와 연산을 기반으로 최근 폭발적인 발전이 있는 연구 분야로 기존의 접근 방법들은 사물을 인식하기 위해 반드시 많은 데이터 학습이 필요하다.

Zero-shot learning은 학습 없이 새로운 사물을 인식한다. 이 연구는 자연어 모델에서 사물에 대한 지식을 힌트로 사용하는 기존의 접근법의 보편화 한계를 비판한다. 그 대안으로 자연어 모델의 지식 대신 시각 모델의 지식을 사용하는 SM-VCENet을 제안한다.
또한 보편화 성능을 측정할 수 있는 새로운 벤치마크 PASCAL2COCO를 제안한다. SM-VCENet은 zero-shot semantic segmentation 벤치마크인 PASCAL-5i에서 많은 차이로 최고 점수를 갱신했고, PASCAL2COCO 벤치마크를 통해 보편화-견고함을 보였다.
논문은 관련 아카이브에서 볼 수 있다.
마인즈랩은 자체 개발한 글로벌 최고 SoTA(State of The Art) 수준의 AI 엔진 40여 개가 있다. 또 외부 엔진까지 조합 가능한 API 커넥터인 ‘마음오케스트라’ 플랫폼을 통해 고객 맞춤형 AI 상담원, AI 돌보미, AI 경비원, AI 속기사 등의 인공 인간을 제작, 공급하고 있다.
