엔비디아 '네모 프레임워크'와 'H100 GPU'로 강화된 LG AI 모델 '엑사원 3.0'

AI 컴퓨팅 기업 엔비디아가 LG AI연구원의 ‘엑사원 3.0(EXAONE 3.0)’에 엔비디아 H100 GPU와 네모(NeMo) 프레임워크가 활용됐다고 24일 밝혔다.

엑사원은 지난 8월에 발표된 LG AI연구원의 AI 파운데이션 모델로, 한국어와 영어, 코딩 등 13개 벤치마크 점수 순위에서 1위를 기록했다. 특히, 메타(Meta)의 라마(Llama) 등 동급 오픈소스 AI 모델과 비교했을 때, 한국어와 영어에서도 우수한 결과를 보였다. 이번에 공개된 엑사원 3.0은 다양한 용도에 맞춰 설계된 언어모델 중 7.8B 인스트럭션 튠드모델을 오픈소스로 제공됐다.

이 모델은 엔비디아 ‘네모’ 프레임워크와 H100 GPU를 사용해 생성AI 모델의 훈련 속도와 정확도를 개선했다. ‘네모’는 생성AI 모델의 구축, 맞춤화, 배포를 지원하는 엔드 투 엔드 프레임워크로, 데이터 처리부터 훈련, 추론까지 모든 단계를 효율화하며, 멀티 노드 및 멀티 GPU를 활용한 가속화된 성능으로 LLM 훈련 시간을 최소화하고 처리량은 극대화한다. 또한, 맞춤화된 모델을 빠르게 배포해 솔루션 구축 시간을 줄여 투자 대비 수익률(ROI)도 증가시킨다.

아울러, 오픈소스 라이브러리 ‘엔비디아 텐서RT-LLM(TensorRT-LLM)’의 SDK를 활용해 LLM의 추론 성능을 가속화 및 최적화해 효율적인 비용으로 모델을 배포할 수 있게 지원한다.

한편, LG AI연구원은 엑사원 3.0을 바탕으로 개발된 엔터프라이즈 AI 에이전트 ‘챗엑사원(ChatEXAONE)'도 공개했다. LG 그룹사를 대상으로 오픈 베타 서비스로 출시된 챗엑사원은 실시간 웹 정보, 문서, 이미지 기반 질의응답과 데이터베이스 관리 등 기업 사용자의 업무 효율성을 높이고 인사이트를 제공한다.

[알림] GTT KOREA와 전자신문인터넷이 오는 9월 27일(금) 서울 양재동 엘타워 그레이스홀(양재역)에서 공동으로 주최하는 “NABS(Next AI & Bigdata Summit) 2024”에서는 “비즈니스에 성공하는 AI & Big Data 혁신 전략”을 주제로 글로벌 AI와 빅데이터 산업을 이끌고 있는 글로벌 리더 기업들이 급변하는 기술과 비즈니스 환경에서 생산성과 효율성 및 비용 절감까지 조직과 비즈니스를 혁신할 수 있는 맞춤형 차세대 AI와 빅데이터 전략을 제시합니다.

장명곤 기자 mgj1020@gttkorea.com

기자의 다른기사

상단영역

본문영역

엔비디아 '네모 프레임워크'와 'H100 GPU'로 강화된 LG AI 모델 '엑사원 3.0'

동급 오픈소스 모델 대비 우수한 성능 확보
챗엑사원, 웹 정보·문서·이미지 기반 질의응답 및 데이터베이스 관리 등 업무 지원

관련기사

본문영역

키워드

관련기사