대규모 생성AI 연구가 국가 경쟁력의 핵심 과제로 부상하면서, 정부 차원의 초거대 AI 개발이 본격화되고 있다. 특히 언어·음성·영상 등 다양한 데이터를 통합적으로 학습하는 멀티모달 모델의 중요성이 커지며, 산업·공공·학술 전반에서 활용 가능한 국산 AI 기반 기술 확보가 절실해지고 있다.

한국전자통신연구원(ETRI)이 과학기술정보통신부가 추진하는 독자 AI 파운데이션 모델 개발 사업에서 엔씨(NC) AI 컨소시엄으로 국가대표 5개 연구팀에 선정돼 지난 8월부터 AI 연구를 본격화했다고 10일 밝혔다.

ETRI 연구진이 산업 AI 전환을 위한 확장 가능한 멀티모달 생성형 파운데이션 모델 개발에 관해 설명하는 모습(자료제공=ETRI)
ETRI 연구진이 산업 AI 전환을 위한 확장 가능한 멀티모달 생성형 파운데이션 모델 개발에 관해 설명하는 모습(자료제공=ETRI)

정부출연연구기관으로는 유일하게 선정돼 국가 연구기관으로서의 위상을 공고히 하고 연구계의 대표성을 확보했다는 점에서 큰 의미가 있다.

ETRI는 ‘산업 AI 전환을 위한 확장 가능한 멀티모달 생성형 파운데이션 모델 개발’과제를 수행하고 있다. 이 과제는 산업 현장에서 활용 가능한 대규모 인공지능 모델을 자체 기술로 구현하는 프로젝트로, 언어·음성·영상 등 다양한 데이터를 통합 처리할 수 있는 멀티 모달 AI 기술 확보를 목표로 한다. 향후 제조·의료·교육·문화 등 주요 산업 전반의 AI 혁신을 가속화할 것으로 기대된다.

ETRI는 한국지능정보사회진흥원(NIA)의 데이터 지원과 정보통신산업진흥원(NIPA)의 GPU 자원 지원을 기반으로 대규모 모델 개발에 필요한 안정적 연구 인프라를 구축했다. 이를 통해 100B(1000억 매개변수)급 모델의 사전학습을 진행하고 있으며, 향후 독자 기술 기반 초거대 AI 모델 개발의 국내 기술 자립화를 견인할 것으로 기대된다.

언어·음성·시각 지능 융합 기술 결집

ETRI 지능정보연구본부는 이번 연구에 그간 수행해 온 자체 국책과제의 핵심 기술을 적극 접목하고 있다.

언어지능연구실은 자체 개발한 언어모델 ‘이글(Eagle)’의 개념적 이해 및 추론 능력, ‘생성형 언어모델의 최신성 학습 기술’의 sparse adapter(희소 어댑터) 기반 지속학습 기술을 대규모 모델에 적용해 모델의 최신성과 효율성을 강화하고 있다.

체화복합지능연구실은 ‘퇴행성 뇌기능 저하 평가 기술’과 ‘다화자 대화 모델링 기술’ 등 기존 연구성과를 토대로 음성·영상 중심의 멀티모달 AI 모델을 개발하고 있으며, 이를 범용 파운데이션 모델로 확장할 계획이다.

시각지능연구실 또한 텍스트 기반 이미지 생성 모델 ‘코알라(KOALA)’, 시각언어 질의응답 모델 ‘코라바(Ko-LLaVA)’등을 통해 축적한 기술을 바탕으로 비전-언어 융합 생성 성능과 AI 안전성을 동시에 강화하는 연구를 추진하고 있다.

ETRI 과제책임자인 권오욱 지능정보연구본부장은 “초기의 자원 확보 난관을 극복하고 100B급 모델 사전학습을 안정적으로 수행하고 있다. NC AI 컨소시엄과의 긴밀한 협력을 통해 산업 AI 전환을 이끄는 멀티모달 파운데이션 모델을 개발해 글로벌 최고 수준의 기술력 확보에 기여하겠다.”라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지