AI 컴퓨팅 글로벌 기업 엔비디아가 특정 산업 요구에 맞는 기업 맞춤형 AI 모델을 구축할 수 있는 ‘엔비디아 AI 파운드리(NVIDIA AI Foundry)’ 서비스를 출시했다.
엔비디아 AI 파운드리는 기업이 데이터, 가속 컴퓨팅, 소프트웨어 도구 등을 사용해 맞춤형 모델을 생성하고 배포할 수 있는 인프라와 도구를 지원한다.

기업들은 엔비디아 AI 파운드리 서비스를 통해 DGX 클라우드, 파운데이션 모델, 엔비디아 네모(NeMo) 소프트웨어, 엔비디아 전문 지식, 에코시스템 도구와 지원을 사용할 수 있다. AI 파운드리를 사용해 메타의 새로운 라마 3.1(Llama 3.1) 컬렉션을 비롯해 다양한 엔비디아와 오픈소스 모델을 맞춤화할 수 있다. 여기에는 엔비디아 네모트론, 구글 딥마인드의 코드젬마와 젬마, 메타의 코드 라마, 미스트랄, 믹스트랄, 마이크로소프트 파이-3, 스타코더2 등이 있다.
엔비디아 AI 파운드리의 핵심 요소
엔비디아 AI 파운드리는 파운데이션 모델, 엔터프라이즈 소프트웨어, 가속 컴퓨팅, 전문가 지원, 광범위한 파트너 에코시스템을 제공한다.
소프트웨어는 엔비디아를 비롯한 AI 커뮤니티의 AI 파운데이션 모델과 모델 개발을 빠르게 추적할 수 있는 엔비디아 네모 소프트웨어 플랫폼이 포함된다.
엔비디아 AI 파운드리의 컴퓨팅 핵심은 엔비디아 DGX 클라우드로, AWS, 구글 클라우드, 오라클 클라우드 인프라스트럭처와 공동 설계된 가속 컴퓨팅 리소스 네트워크다. 고객은 DGX 클라우드로 쉽고 효율적으로 맞춤형 생성AI 애플리케이션을 개발하고 미세 조정할 수 있다.
필요에 따라 엔비디아 AI 엔터프라이즈(AI Enterprise) 전문가의 도움을 받을 수도 있다. 엔비디아 전문가는 독점 데이터를 사용해 모델을 구축, 미세 조정, 배포하는 데 필요한 각 단계를 고객에게 안내해, 모델이 비즈니스 요구사항과 완벽히 부합하도록 보장할 수 있다.
또한 다양한 지원을 제공하는 글로벌 파트너 에코시스템에 액세스할 수 있다. 액센츄어, 딜로이트, 인포시스, 위프로는 모두 엔비디아 파트너 사들로 AI 기반 디지털 전환 프로젝트의 설계, 구현, 관리를 포괄하는 AI 파운드리 컨설팅 서비스를 제공한다. 액센츄어는 맞춤형 모델 개발을 위한 자체 AI 파운드리 기반 제품인 액센츄어 AI 리파이너리(Refinery) 프레임워크를 최초로 제공한다.
데이터 몬스터즈, 퀀티파이, 슬라럼, 소프트서브와 같은 서비스 제공 파트너는 기업이 기존 IT 환경에 AI를 통합하는 복잡한 문제 해결을 돕는다.
또한 클린랩, 데이터독, 데이터이쿠, 데이터루프, 데이터로봇, 도미노 데이터 랩, 피들러 AI, 뉴렐릭, 스케일, 웨이츠 앤드 바이어시스와 같은 파트너의 AIOps와 MLOps 플랫폼을 사용해 프로덕션용 엔비디아 AI 파운드리 모델을 개발할 수 있다.
AI 파운드리 모델을 맞춤형 모델, 최적화된 엔진, 표준 API를 포함하는 엔비디아 NIM 추론 마이크로서비스로 출력해 원하는 가속 인프라에서 실행할 수 있다.
엔비디아 텐서RT-LLM(TensorRT-LLM)과 같은 추론 솔루션은 지연 시간을 최소화하고 처리량을 극대화하기 위해 라마 3.1 모델의 효율성을 개선한다. 이를 통해 기업은 토큰을 더 빠르게 생성하는 동시에 프로덕션에서 모델을 실행하는 데 드는 총 비용을 절감할 수 있다. 엔터프라이즈급 지원과 보안은 엔비디아 AI 엔터프라이즈 소프트웨어 제품군에서 제공한다.
광범위한 배포 옵션에는 시스코, 델 테크놀로지스, 휴렛팩커드 엔터프라이즈, 레노버, 슈퍼마이크로를 비롯한 글로벌 서버 제조 파트너의 엔비디아 인증 시스템이 있다. 또한, 아마존 웹 서비스, 구글 클라우드, 오라클 클라우드 인프라스트럭처의 클라우드 인스턴스도 포함된다.
맞춤형 모델 개발 가속하고 간소화하는 엔비디아 네모
엔비디아 네모가 AI 파운드리에 통합됨에 따라 개발자들은 데이터 큐레이션, 파운데이션 모델 맞춤화와 성능 평가에 필요한 도구를 손쉽게 사용할 수 있다.
네모 큐레이터(NeMo Curator)는 GPU 가속 데이터 큐레이션 라이브러리로, 사전 훈련과 미세 조정을 위한 대규모 고품질 데이터 세트를 준비해 생성형 AI 모델 성능을 향상시킨다.
네모 커스터마이저(NeMo Customizer)는 확장 가능한 고성능 마이크로 서비스로, 도메인별 사용 사례에 대한 거대 언어 모델(large language model, LLM)의 미세 조정과 정렬을 단순화한다.
네모 이밸류에이터(NeMo Evaluator)는 가속화된 클라우드나 데이터 센터에 있는 학술과 맞춤형 벤치마크 전반에 걸쳐 생성형 AI 모델을 자동으로 평가한다.
네모 가드레일(NeMo Guardrails)은 대화 관리를 조정해 LLM이 있는 스마트 애플리케이션에서의 정확성, 적절성, 보안을 지원한다. 이를 통해 생성형 AI 애플리케이션을 위한 안전 장치를 제공한다.
기업은 엔비디아 AI 파운드리의 네모 플랫폼을 사용해 요구가 정확하게 반영된 맞춤형 AI 모델을 만들 수 있다. 이러한 맞춤화를 통해 전략적 목표에 더 잘 부합하고, 의사 결정의 정확성을 높이고, 운영 효율성을 개선할 수 있다. 예를 들어, 기업은 산업별 전문 용어를 이해하고 규제 요건을 준수하며 기존 워크플로우와 원활하게 통합되는 모델을 개발할 수 있다.
기업들은 엔비디아 네모 리트리버(Retriever) NIM 추론 마이크로서비스를 통해 맞춤형 AI 모델을 프로덕션에 배포할 수 있다. 이를 통해 개발자는 독점 데이터를 가져와 검색 증강 생성(retrieval-augmented generation, RAG)을 통해 AI 애플리케이션에 대한 지식이 풍부한 응답을 생성할 수 있다.
관련기사
- LLM 정확도·처리 속도 높이는 ‘엔비디아 네모 리트리버 NIM’ 마이크로서비스
- [Success Story] 다양한 산업의 클라우드 전환 성공 도우미 ‘오라클 클라우드 VM웨어’
- 막대한 AI·클라우드 처리 ‘데이터 센터 가속기’가 대안
- AI 데이터센터 에너지 문제, 빅 테크가 해결할 수 있을까?
- 작지만 강한 GPGPU AI 슈퍼컴퓨터...항공우주용으로 쌩쌩
- 고품질 센서 시뮬레이션 구현하는 엔비디아 ‘옴니버스 클라우드 센서 RTX’
- 정교해지는 사이버 위협 ‘AI 사이버 보안’ 활용 가속
- HPE, 파트너용 신규 AI 및 하이브리드 클라우드 프로그램 공개
- “퓨어스토리지의 혁신은 구독형 스토리지 STaaS로 AI 및 사이버 복원력 향상”
- 오픈AI·마이크로소프트와 만난 최태원 SK그룹 회장의 속 사정
- 뉴렐릭 '옵저버빌리티 플랫폼', 엔비디아 NIM에 통합
- 한국레노버, AI 노트북 ‘최대 26%’ 할인 이벤트 진행
- AI 잠재력 최대화하는 데이터 솔루션
- 엔비디아, 차세대 AI 전력망 관리 전략 제시
- 정부 구축·지원 "AI 보안 위협에 대응하는 AI 데이터 셋"...글로벌 보안 경쟁력↑
- 엔비디아, 휴머노이드 로봇 개발 가속화 지원
- 유블럭스 ‘고정밀 위치추적 솔루션’, 엔비디아 ‘자율주행 개발 플랫폼’ 지원 강화
- 엔비디아, 고객과 상호작용하는 맞춤형 디지털 휴먼 '제임스' 선봬
- 장수풍뎅이처럼 나는 비행 로봇 '쿠비틀'
- 인텔, 내년 18A 기반 클라이언트 및 서버용 프로세서 생산 예고
- 식신, ‘아마존 베드록’ 활용 LLM 기반 ‘AI 맛집 대시보드’ 개발
- 슈퍼마이크로, 즉시 사용할 수 있는 엔비디아 옴니버스용 '슈퍼클러스터' 출시
- ‘델 테크놀로지스 포럼 2024’ 개최...AI 시대 도전과제와 해법 제시
- 기업 생산성·보안성 높이는 'AWS 생성AI 신규 야심작' 공개
- 델-뉴타닉스, 관리 편하고 비용 절감하는 클라우드 간소화 솔루션 선봬
- 현대자동차·기아, 빅3 신용 평가기관서 'A'등급...글로벌 자동차 기업 위상 강화
- 레노버, ‘인텔 14세대 i7·엔디비아 RTX 4060 Ti ’ 품은 고성능 데스크톱 2종 출시
- 인포시스·엔비디아 합작 고성능 생성AI 통신 솔루션...네트워크 운영효율·생산성↑
- 한국레노버, ‘기능성·디자인·경제성’ 갖춘 다용도 모니터 출시
- 슈퍼마이크로, ‘인텔 제온6 프로세서’ 탑재 ‘X14 서버’ 플랫폼7...AI·HPC 처리 성능 강화
- 레노버, ‘코파일럿+PC’로 생산성 강화한 AI PC 선봬
- 한국레노버, ‘AI 지원 프리미엄 씽크패드’ 기획전 진행
- 레노버, 손바닥 만한 초소형 AI 데스크톱 '씽크센터 네오 울트라' 출시
- 데이터 중심의 기업 혁신 동반자 범용 AI 통합 플랫폼 데이터이쿠
- 웨카, 슈퍼컴퓨팅 2024 참가...엔비디아 CPU 기반 AI 스토리지 클러스터 공개
- 슈퍼마이크로, ‘직접 액체 냉각·엔비디아 블랙웰’ 기반 AI 데이터센터 서버 제품군 출시
- ‘데이터 기반 지능화’로 DX 혁신한 LG화학이 그리는 지속가능한 미래
