LLM 올인원 솔루션 기업 올거나이즈(대표 이창수)가 한국어 실무에 강한 LLM인 '알파-인스트럭트(Alpha-Instruct)’를 출시한다고 3일 밝혔다.

올거나이즈는 한국어 실무에 특화된 LLM ‘알파-인스트럭트’ 오픈소스로 3일 출시했다.
올거나이즈는 한국어 실무에 특화된 LLM ‘알파-인스트럭트’ 오픈소스로 3일 출시했다.

올거나이즈의 알파-인스트럭트 모델은 메타의 오픈소스 LLM인 ‘라마3’를 기반으로 제작된 매개변수 80억 규모의 경량 LLM이다. 라마3를 한국어 이해 가능하게 개량한 모델과 지시 사항을 수행하는 데 특화된 라마3의 인스트럭트 모델을 병합하는 방식으로 제작됐다. 이후 일반적인 답변 기반 지시 사항 데이터 세트 2000개를 추가 학습해 동일 대답 반복하여 오류를 최소화했다.

알파-인스트럭트 모델은 한국어 언어모델의 다분야 사고력을 측정하는 ‘LogicKor’ 리더보드에서도 글쓰기 및 이해 부분에서 높은 점수를 기록했다. ‘LogicKor’는 한국어 추론, 수학, 글쓰기, 코딩, 이해 등의 요소를 측정하는 언어모델 벤치마크이다.

올거나이즈는 알파-인스트럭트 모델을 오픈소스로 공개해 라이선스 제한 없이 자유롭게 사용하게 할 예정이다. 또한 올거나이즈의 알리 플랫폼 내에서 알파-인스트럭트 모델을 사용하거나 기업 특화모델로 파인튜닝이 가능하다.  또한 LLM을 내부 데이터에 연결해서 검색증강생성(RAG) 솔루션과 결합해 활용할 수 있다.

이창수 올거나이즈 대표는 “완성도 높은 한국어 모델을 만들기 위해 데이터 세트를 구성하고, 다양한 방법론에 대한 많은 테스트를 거쳐 극히 적은 리소스만으로 성능 좋은 모델을 만들 수 있었다.”라며, “앞으로도 최신 오픈소스 모델의 성능을 평가하고, 고객이 효율적으로 활용할 수 있는 모델을 지속적으로 만들어 나갈 것”이라고 밝혔다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지