인공지능 전자문서 기업 유니닥스(대표 정기태)가 자사의 인공지능 솔루션 ‘ezMyAIDoctor’에 활용된 헬스케어 sLLM(소형언어모델)을 허깅페이스에 무료 공개했다고 18일 밝혔다.

이번에 선보인 sLLM은 한국지능정보원(NIA)에서 운영하는 AI 통합 플랫폼 AI Hub에 공개된 ‘초거대 AI 헬스케어 질의응답 데이터’ 기반으로 개발되어, 메타의 LLaMA 3.1 모델 사전 학습과 직접신호최적화(SFT) 및 가독미세조정(DPO) 기법을 거쳐 미세 조정됐다.

유니닥스의 sLLM이 허깅페이스에 무료 공개됐다.(자료제공=유니닥스)
유니닥스의 sLLM이 허깅페이스에 무료 공개됐다.(자료제공=유니닥스)

이번 개발에는 위키피디아 및 AI Hub에 공개된 2억 어절의 ‘헬스케어 질의응답 데이터’, 20억 어절의 ‘한국어 성능이 개선된 초거대 AI 말뭉치’, 약 5천 어절의 ‘의료 및 법률 전문 서적의 말뭉치’ 등이 포함됐다.

인공지능 모델이 획득한 지식을 측정하는 MMLU 벤치마크 내 의료 카테고리에서 유니닥스 자체 테스트 결과,  메타에서 제공한 기본 모델 llama31_8b_instruct 대비 벤치마크 평균 수치가 0.71에서 0.72로 0.01 상승한 것으로 나타났다.

다만, 공개된 데이터는 질병에 대한 이해를 돕지만 진단과 치료방법을 보장하지 않아 정확한 진단은 전문의와 상담이 필요하다.

유니닥스는 2022년 9월 AI 사업본부 설립 후 전자문서 외 다양한 산업분야에서 유니닥스만의 학습 데이터 구축 및 AI 모델 개발 방법론을 제시하고 있다. 시각장애인용 표데이터 음성변환 AI 서비스 개발과 치매 노인 사전진단을 위한 인공지능 모델 데이터 구축 등 다수의 의료분야 프로젝트 뿐 아니라 NIA의 초거대 AI 생태계 구축사업 및 자율주행 개발사업 등에도 참여하고 있다.

유니닥스 유석 AI사업본부장은 “이번 모델 공개는 유니닥스의 sLLM구축 역량을 보여주고 있다.”라며, “이번에 쌓은 경험과 지식으로 법률, 금융, 교육 등 다양한 전문 분야로 sLLM 를 구축하고 산업 특화 문서 기반 생성AI 시스템으로의 확장이 기대된다.”라고 밝혔다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지