AI 컴퓨팅 기업 엔비디아가 LG AI연구원의 ‘엑사원 3.0(EXAONE 3.0)’에 엔비디아 H100 GPU와 네모(NeMo) 프레임워크가 활용됐다고 24일 밝혔다.

엑사원은 지난 8월에 발표된 LG AI연구원의 AI 파운데이션 모델로, 한국어와 영어, 코딩 등 13개 벤치마크 점수 순위에서 1위를 기록했다. 특히, 메타(Meta)의 라마(Llama) 등 동급 오픈소스 AI 모델과 비교했을 때, 한국어와 영어에서도 우수한 결과를 보였다. 이번에 공개된 엑사원 3.0은 다양한 용도에 맞춰 설계된 언어모델 중 7.8B 인스트럭션 튠드모델을 오픈소스로 제공됐다.

이 모델은 엔비디아 ‘네모’ 프레임워크와 H100 GPU를 사용해 생성AI 모델의 훈련 속도와 정확도를 개선했다. ‘네모’는 생성AI 모델의 구축, 맞춤화, 배포를 지원하는 엔드 투 엔드 프레임워크로, 데이터 처리부터 훈련, 추론까지 모든 단계를 효율화하며, 멀티 노드 및 멀티 GPU를 활용한 가속화된 성능으로 LLM 훈련 시간을 최소화하고 처리량은 극대화한다. 또한, 맞춤화된 모델을 빠르게 배포해 솔루션 구축 시간을 줄여 투자 대비 수익률(ROI)도 증가시킨다.

아울러, 오픈소스 라이브러리 ‘엔비디아 텐서RT-LLM(TensorRT-LLM)’의 SDK를 활용해 LLM의 추론 성능을 가속화 및 최적화해 효율적인 비용으로 모델을 배포할 수 있게 지원한다.

한편, LG AI연구원은 엑사원 3.0을 바탕으로 개발된 엔터프라이즈 AI 에이전트 ‘챗엑사원(ChatEXAONE)'도 공개했다. LG 그룹사를 대상으로 오픈 베타 서비스로 출시된 챗엑사원은 실시간 웹 정보, 문서, 이미지 기반 질의응답과 데이터베이스 관리 등 기업 사용자의 업무 효율성을 높이고 인사이트를 제공한다.

 

[알림] GTT KOREA와 전자신문인터넷이 오는 9월 27일(금) 서울 양재동 엘타워 그레이스홀(양재역)에서 공동으로 주최하는 “NABS(Next AI & Bigdata Summit) 2024”에서는 “비즈니스에 성공하는 AI & Big Data 혁신 전략”을 주제로 글로벌 AI와 빅데이터 산업을 이끌고 있는 글로벌 리더 기업들이 급변하는 기술과 비즈니스 환경에서 생산성과 효율성 및 비용 절감까지 조직과 비즈니스를 혁신할 수 있는 맞춤형 차세대 AI와 빅데이터 전략을 제시합니다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지