AI 기반 애플리케이션이 점차 복잡해지면서, 개발자와 기업은 더욱 정교한 추론 기능을 갖춘 AI 모델을 필요로 하고 있다. 기존 AI 모델들은 데이터 처리 및 추론 속도에서 한계를 보이며, 고급 의사 결정 능력을 갖춘 AI 에이전트의 구축이 어려웠다. 이에 따라 엔터프라이즈 환경에서 정확성과 신뢰성을 보장하는 새로운 AI 추론 기술이 요구되고 있다.
엔비디아가 GTC에서 개방형 AI 추론 모델 제품군인 라마 네모트론(NVIDIA Llama Nemotron)을 발표했다.

이 모델은 온디맨드 AI 추론 기능을 제공하며, 개발자와 기업이 비즈니스 환경에서 즉시 활용할 수 있도록 설계되었다. 엔비디아는 사후 훈련(Post-Training) 과정을 통해 모델의 다단계 수학, 코딩, 추론, 복잡한 의사 결정 능력을 향상시켰으며, 기존 모델 대비 정확도를 20% 개선하고 추론 속도를 5배 향상시켰다.
라마 네모트론의 주요 기술적 특징
라마 네모트론 모델 제품군은 다양한 배포 환경을 고려하여 ▲PC와 에지 디바이스에서 높은 정확도를 제공하는 나노(Nano) ▲ 단일 GPU에서 최고의 정확도와 처리량을 보장하는 슈퍼(Super) ▲다중 GPU 서버 환경에서 최상의 성능을 발휘하는 울트라(Ultra) 모델로 엔비디아 NIM 마이크로서비스로 제공된다.
엔비디아는 이 모델의 성능을 극대화하기 위해 DGX 클라우드를 활용한 광범위한 사후 훈련을 수행했으며, 고품질 큐레이션 합성 데이터와 추가 데이터 세트를 결합하여 모델의 정확성과 효율성을 향상시켰다.
다양한 기업과 협력
엔비디아는 다양한 산업 분야의 기업들과 협력하여 라마 네모트론 추론 모델을 활용한 AI 솔루션을 개발하고 있다.
마이크로소프트는 애저 AI 파운드리(Azure AI Foundry) 플랫폼에 라마 네모트론 모델을 통합하여 기업이 AI 에이전트를 손쉽게 배포할 수 있도록 지원한다.
SAP는 SAP 비즈니스 AI 솔루션 및 AI 코파일럿 줄(Joule)에 라마 네모트론 모델을 적용하여 AI 기반 업무 자동화 및 코드 완성도를 향상시킨다.
서비스나우는 AI 기반 업무 생산성을 강화하는 AI 에이전트 구축을 위해 라마 네모트론 모델을 도입한다.
딜로이트는 조라(Zora) AI 에이전트 플랫폼에 라마 네모트론 모델을 적용하여 기업의 의사 결정 지원 기능을 강화한다.
액센츄어는 AI 리파이너리(AI Refinery) 플랫폼에 라마 네모트론 모델을 도입하여 산업별 맞춤형 AI 솔루션을 개발한다.
에이전틱 AI 개발 지원
엔비디아는 에이전틱 AI 개발을 지원하기 위해 AI-Q 블루프린트, AI 데이터 플랫폼, NIM 마이크로서비스 등 다양한 도구와 기술을 제공하고 있다.
AI-Q 블루프린트는 AI 에이전트가 데이터를 기반으로 인지, 추론, 행동할 수 있도록 지원하는 프레임워크이다.
AI 데이터 플랫폼는 AI-Q 블루프린트를 기반으로 AI 쿼리 에이전트를 구축하는 맞춤형 참조 설계이다.
NIM 마이크로서비스는 AI 모델의 실시간 적응과 지속적인 학습을 가능하게 하는 서비스로, 메타(Meta), 마이크로소프트, 미스트랄 AI(Mistral AI) 등과 협력하여 최신 모델을 안정적으로 배포할 수 있도록 지원한다.
네모 마이크로서비스는 AI 에이전트가 지속적으로 학습할 수 있도록 데이터 플라이휠(flywheel)을 구축하는 엔터프라이즈 솔루션을 제공한다.
엔비디아의 라마 네모트론 추론 모델은 AI 추론 성능을 향상시키고 기업이 맞춤형 AI 에이전트를 구축할 수 있도록 지원한다. 이를 통해 다양한 산업에서 AI 기반 의사 결정을 강화하고 비즈니스 혁신을 가속화할 것으로 기대된다. 향후 엔비디아는 지속적인 연구와 협력을 통해 AI 추론 모델을 더욱 정교화하고, 기업이 AI를 보다 효과적으로 활용할 수 있도록 지원할 계획이다.
관련기사
- AWS 코리아, “생성AI·데이터 기반 고객 수익 창출 집중”
- 슈나이더 일렉트릭-SKT, AI 데이터센터 MEP 시스템 분야 혁신 협력
- 레노버, 인텔 코어 울트라 프로세서 탑재 게이밍 데스크탑 ‘리전 타워 7i’ 출시
- 시스코-엔비디아, 기업 AI 워크로드 최적화 통합 아키텍처 공동 개발
- HPE, 엔비디아 블랙웰 기반 수랭식 AI 시스템 출시
- 엔비디아, AI 모델 성능 높이는 '스케일링 법칙' 공개
- 엔비디아 DPU·AI 기반 제로 트러스트 지원 ‘산업용 사이버 보안 플랫폼’
- 엔비디아 NIM·NeMo로 ‘AI·개발 프로세스 통합’...SW 개발 속도 단축
- ‘지능형 영상 관리·엔비디아 젯슨 오린 에지 AI 결합’ 실시간 영상 감시 솔루션...보안성·인사이트 도출↑
- 엔비디아, AI 스토리지 최대 48% 가속하는 스펙트럼-X 네트워킹 플랫폼 발표
- 맞춤형 AI 영업 에이전트, 고객 참여·판매 전환율 극대화
- 엔비디아, NIM에서 딥시크-R1 지원
- SAP, 비즈니스 데이터 클라우드 및 AI 코파일럿 '쥴' 한국어 지원 발표
- AI 에이전트 재정의하는 ‘엔비디아 AI 엔터프라이즈’
- 엔비디아, AI 에이전트 워크플로 간소화하는 NIM 마이크로서비스 출시
- 마이크로소프트, ‘책임 있는 AI·추론 기반 에이전트’ 공개 및 한국과 AI 협력 확대 발표
- 정확도·생산성 높이는 ‘시각적 AI 개발 워크플로’...데이터 품질 개선·모델 분석 간소화로 대규모 AI 구축 가속
- 초저전력 고성능 AI 모듈, 에지 디바이스 혁신
- 엔비디아, AI 수학 올림피아드에서 1위
