AI 컴퓨팅 기업 엔비디아가 LG AI연구원의 ‘엑사원 3.0(EXAONE 3.0)’에 엔비디아 H100 GPU와 네모(NeMo) 프레임워크가 활용됐다고 24일 밝혔다.

엑사원은 지난 8월에 발표된 LG AI연구원의 AI 파운데이션 모델로, 한국어와 영어, 코딩 등 13개 벤치마크 점수 순위에서 1위를 기록했다. 특히, 메타(Meta)의 라마(Llama) 등 동급 오픈소스 AI 모델과 비교했을 때, 한국어와 영어에서도 우수한 결과를 보였다. 이번에 공개된 엑사원 3.0은 다양한 용도에 맞춰 설계된 언어모델 중 7.8B 인스트럭션 튠드모델을 오픈소스로 제공됐다.
이 모델은 엔비디아 ‘네모’ 프레임워크와 H100 GPU를 사용해 생성AI 모델의 훈련 속도와 정확도를 개선했다. ‘네모’는 생성AI 모델의 구축, 맞춤화, 배포를 지원하는 엔드 투 엔드 프레임워크로, 데이터 처리부터 훈련, 추론까지 모든 단계를 효율화하며, 멀티 노드 및 멀티 GPU를 활용한 가속화된 성능으로 LLM 훈련 시간을 최소화하고 처리량은 극대화한다. 또한, 맞춤화된 모델을 빠르게 배포해 솔루션 구축 시간을 줄여 투자 대비 수익률(ROI)도 증가시킨다.
아울러, 오픈소스 라이브러리 ‘엔비디아 텐서RT-LLM(TensorRT-LLM)’의 SDK를 활용해 LLM의 추론 성능을 가속화 및 최적화해 효율적인 비용으로 모델을 배포할 수 있게 지원한다.
한편, LG AI연구원은 엑사원 3.0을 바탕으로 개발된 엔터프라이즈 AI 에이전트 ‘챗엑사원(ChatEXAONE)'도 공개했다. LG 그룹사를 대상으로 오픈 베타 서비스로 출시된 챗엑사원은 실시간 웹 정보, 문서, 이미지 기반 질의응답과 데이터베이스 관리 등 기업 사용자의 업무 효율성을 높이고 인사이트를 제공한다.
관련기사
- “NABS 2024, 글로벌 빅테크가 전하는 비즈니스 혁신 AI·빅데이터 실용 전략”
- 무선 네트워크 최적화하는 AI-RAN 플랫폼 '엔비디아 AI 에리얼'
- AI 위협·AI 기술 이슈 및 7대 공격 벡터 대응 통합 보안 플랫폼 ‘트렌드 비전 원’
- 세일즈포스-엔비디아-구글-IBM, 멀티모달 활용 ‘AI 아바타’ 개발 및 활성화 협력
- ICTK, 글로벌 스타트업 경연 대회 '서울 유니콘 챌린지' 대상 수상
- AI·멀티 클라우드 수요 급증...OCI ‘인프라·소버린·리전·DB’로 대응
- 레노버, 손바닥 만한 초소형 AI 데스크톱 '씽크센터 네오 울트라' 출시
- 엔비디아-오라클, 엑사스케일보다 1000배 우수한 AI 컴퓨팅 'OCI 슈퍼클러스터' 발표
- 라이언로켓-리얼드로우-타입캐스트, AWS ‘글로벌 생성AI 엑셀러레이터 프로그램’ 선정
- 옵티코어, 디에스앤지에 20억 규모 'AI 데이터센터용 고속 광트랜시버' 공급
- 공급망 AI, 가시성·투명성 향상으로 폭발적 성장세
- 철도 분석 시스템에 들어가는 엔비디아 AI 솔루션...안전성·운영효율성·비용절감 효과↑
- 윈드리버, AI 워크로드 최적화하는 엔터프라이즈 리눅스 ‘엘릭사 프로’ 출시
- 엔비디아, 'AI 포용성 이니셔티브' 참여
- 엔비디아, AI 기반 메타휴먼 개발 지원 ‘언리얼 엔진 5 온디바이스 플러그인’ 출시
- 엔비디아, 마이크로소프트 애저와 오픈AI에 '블랙웰' 공급
- GPU 효율 극대화 ‘AI 가속 플랫폼’...하드웨어 비용↓운영 효율↑
