AI 컴퓨팅 글로벌 기업 엔비디아가 특정 산업 요구에 맞는 기업 맞춤형 AI 모델을 구축할 수 있는 ‘엔비디아 AI 파운드리(NVIDIA AI Foundry)’ 서비스를 출시했다.

엔비디아 AI 파운드리는 기업이 데이터, 가속 컴퓨팅, 소프트웨어 도구 등을 사용해 맞춤형 모델을 생성하고 배포할 수 있는 인프라와 도구를 지원한다. 

기업들은 엔비디아 AI 파운드리 서비스를 통해 DGX 클라우드, 파운데이션 모델, 엔비디아 네모(NeMo) 소프트웨어, 엔비디아 전문 지식, 에코시스템 도구와 지원을 사용할 수 있다. AI 파운드리를 사용해 메타의 새로운 라마 3.1(Llama 3.1) 컬렉션을 비롯해 다양한 엔비디아와 오픈소스 모델을 맞춤화할 수 있다. 여기에는 엔비디아 네모트론, 구글 딥마인드의 코드젬마와 젬마, 메타의 코드 라마, 미스트랄, 믹스트랄, 마이크로소프트 파이-3, 스타코더2 등이 있다.

엔비디아 AI 파운드리의 핵심 요소

엔비디아 AI 파운드리는 파운데이션 모델, 엔터프라이즈 소프트웨어, 가속 컴퓨팅, 전문가 지원, 광범위한 파트너 에코시스템을 제공한다.

소프트웨어는 엔비디아를 비롯한 AI 커뮤니티의 AI 파운데이션 모델과 모델 개발을 빠르게 추적할 수 있는 엔비디아 네모 소프트웨어 플랫폼이 포함된다.

엔비디아 AI 파운드리의 컴퓨팅 핵심은 엔비디아 DGX 클라우드로, AWS, 구글 클라우드, 오라클 클라우드 인프라스트럭처와 공동 설계된 가속 컴퓨팅 리소스 네트워크다. 고객은 DGX 클라우드로 쉽고 효율적으로 맞춤형 생성AI 애플리케이션을 개발하고 미세 조정할 수 있다. 

필요에 따라 엔비디아 AI 엔터프라이즈(AI Enterprise) 전문가의 도움을 받을 수도 있다. 엔비디아 전문가는 독점 데이터를 사용해 모델을 구축, 미세 조정, 배포하는 데 필요한 각 단계를 고객에게 안내해, 모델이 비즈니스 요구사항과 완벽히 부합하도록 보장할 수 있다.

또한 다양한 지원을 제공하는 글로벌 파트너 에코시스템에 액세스할 수 있다. 액센츄어, 딜로이트, 인포시스, 위프로는 모두 엔비디아 파트너 사들로 AI 기반 디지털 전환 프로젝트의 설계, 구현, 관리를 포괄하는 AI 파운드리 컨설팅 서비스를 제공한다. 액센츄어는 맞춤형 모델 개발을 위한 자체 AI 파운드리 기반 제품인 액센츄어 AI 리파이너리(Refinery) 프레임워크를 최초로 제공한다.

데이터 몬스터즈, 퀀티파이, 슬라럼, 소프트서브와 같은 서비스 제공 파트너는 기업이 기존 IT 환경에 AI를 통합하는 복잡한 문제 해결을 돕는다. 

또한 클린랩, 데이터독, 데이터이쿠, 데이터루프, 데이터로봇, 도미노 데이터 랩, 피들러 AI, 뉴렐릭, 스케일, 웨이츠 앤드 바이어시스와 같은 파트너의 AIOps와 MLOps 플랫폼을 사용해 프로덕션용 엔비디아 AI 파운드리 모델을 개발할 수 있다. 

AI 파운드리 모델을 맞춤형 모델, 최적화된 엔진, 표준 API를 포함하는 엔비디아 NIM 추론 마이크로서비스로 출력해 원하는 가속 인프라에서 실행할 수 있다.

엔비디아 텐서RT-LLM(TensorRT-LLM)과 같은 추론 솔루션은 지연 시간을 최소화하고 처리량을 극대화하기 위해 라마 3.1 모델의 효율성을 개선한다. 이를 통해 기업은 토큰을 더 빠르게 생성하는 동시에 프로덕션에서 모델을 실행하는 데 드는 총 비용을 절감할 수 있다. 엔터프라이즈급 지원과 보안은 엔비디아 AI 엔터프라이즈 소프트웨어 제품군에서 제공한다.

광범위한 배포 옵션에는 시스코, 델 테크놀로지스, 휴렛팩커드 엔터프라이즈, 레노버, 슈퍼마이크로를 비롯한 글로벌 서버 제조 파트너의 엔비디아 인증 시스템이 있다. 또한, 아마존 웹 서비스, 구글 클라우드, 오라클 클라우드 인프라스트럭처의 클라우드 인스턴스도 포함된다.

맞춤형 모델 개발 가속하고 간소화하는 엔비디아 네모

엔비디아 네모가 AI 파운드리에 통합됨에 따라 개발자들은 데이터 큐레이션, 파운데이션 모델 맞춤화와 성능 평가에 필요한 도구를 손쉽게 사용할 수 있다. 

네모 큐레이터(NeMo Curator)는 GPU 가속 데이터 큐레이션 라이브러리로, 사전 훈련과 미세 조정을 위한 대규모 고품질 데이터 세트를 준비해 생성형 AI 모델 성능을 향상시킨다.

네모 커스터마이저(NeMo Customizer)는 확장 가능한 고성능 마이크로 서비스로, 도메인별 사용 사례에 대한 거대 언어 모델(large language model, LLM)의 미세 조정과 정렬을 단순화한다.

네모 이밸류에이터(NeMo Evaluator)는 가속화된 클라우드나 데이터 센터에 있는 학술과 맞춤형 벤치마크 전반에 걸쳐 생성형 AI 모델을 자동으로 평가한다.

네모 가드레일(NeMo Guardrails)은 대화 관리를 조정해 LLM이 있는 스마트 애플리케이션에서의 정확성, 적절성, 보안을 지원한다. 이를 통해 생성형 AI 애플리케이션을 위한 안전 장치를 제공한다.

기업은 엔비디아 AI 파운드리의 네모 플랫폼을 사용해 요구가 정확하게 반영된 맞춤형 AI 모델을 만들 수 있다. 이러한 맞춤화를 통해 전략적 목표에 더 잘 부합하고, 의사 결정의 정확성을 높이고, 운영 효율성을 개선할 수 있다. 예를 들어, 기업은 산업별 전문 용어를 이해하고 규제 요건을 준수하며 기존 워크플로우와 원활하게 통합되는 모델을 개발할 수 있다.

기업들은 엔비디아 네모 리트리버(Retriever) NIM 추론 마이크로서비스를 통해 맞춤형 AI 모델을 프로덕션에 배포할 수 있다. 이를 통해 개발자는 독점 데이터를 가져와 검색 증강 생성(retrieval-augmented generation, RAG)을 통해 AI 애플리케이션에 대한 지식이 풍부한 응답을 생성할 수 있다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지