AI 에이전트 기술이 기업 생산성 혁신의 핵심 기술로 떠오르고 있다. 특히, AI 기반 업무 자동화와 협업이 확산되는 가운데, AI 시스템의 정확성, 응답성, 지속적 최적화를 위한 ‘데이터 플라이휠’ 기반 기술이 필수로 부각되고 있다.

엔비디아가 기업 맞춤형 AI 에이전트 구축을 지원하는 ‘네모 마이크로서비스’를 정식 출시했다고 밝혔다. 해당 기술은 기업이 AI 에이전트를 디지털 팀원으로 온보딩해 직원의 생산성을 높이고, AI 추론 결과 및 사용자 피드백을 통해 지속적으로 성능을 최적화하도록 지원한다.

엔비디아 네모 마이크로서비스로 구축된 데이터 플라이휠은 사람의 개입을 최소화하고 자율성을 극대화하면서 데이터를 지속적으로 선별하고, 모델을 재훈련하며, 성능을 평가한다.
엔비디아 네모 마이크로서비스로 구축된 데이터 플라이휠은 사람의 개입을 최소화하고 자율성을 극대화하면서 데이터를 지속적으로 선별하고, 모델을 재훈련하며, 성능을 평가한다.

데이터 중심의 AI 최적화 구조 실현

엔비디아 네모 마이크로서비스는 AI 에이전트가 지속적으로 학습하고 개선할 수 있도록 데이터 플라이휠 구조를 구현한다. 이 구조는 추론 데이터, 비즈니스 데이터, 사용자 피드백이라는 세 가지 핵심 데이터를 중심으로 모델 성능을 강화하며, 에이전트가 수행하는 업무의 정확성과 실행력을 높인다. 개발자는 이를 통해 ‘인사이트 기반의 실행형 AI’를 구현할 수 있다.

제품은 네모 커스터마이저, 이밸류에이터, 가드레일 등 다양한 모듈로 구성된다. 네모 커스터마이저는 LLM을 빠르게 미세 조정하고 1.8배 향상된 처리량을 제공한다. 네모 이밸류에이터는 단 5번의 API 호출로 모델 평가를 단순화하며, 가드레일은 규정 준수 보안을 1.4배 강화하면서도 지연시간을 0.5초 내로 최소화한다. 또한, 네모 리트리버, 큐레이터 등과 연계해 맞춤형 데이터 플라이휠을 기업 내부에 쉽게 구현할 수 있도록 지원한다.

개발자들은 클라우드 및 온프레미스 환경 어디서든 네모 마이크로서비스를 사용할 수 있으며, 엔비디아 AI 엔터프라이즈 플랫폼을 통해 보안성과 안정성이 확보된 배포가 가능하다. 이를 통해 다양한 산업군은 수백 개의 특화된 에이전트를 협업시키는 멀티 에이전트 시스템을 손쉽게 도입할 수 있다.

AT&T는 매주 1만 건의 문서를 자동 처리하는 고성능 AI 에이전트를 네모 마이크로서비스 기반으로 개발했으며, 사기 방지 및 네트워크 최적화에 활용되는 미스트랄 모델을 통해 정확도를 최대 40% 향상시켰다. 블랙록은 자사의 투자 플랫폼 ‘알라딘’에 에이전틱 AI 기능을 접목했고, 시스코는 코딩 오류를 줄이고 응답 속도를 10배 개선한 개발자 도우미를 구축했다.

또한, 나스닥은 네모 리트리버와 NIM 마이크로서비스를 활용해 검색 기능 정확도를 30% 향상시키는 동시에 비용도 절감했다. 이외에도 메타, 데이터이쿠, 클라우데라, 데이터스택스, SAP 등 주요 기업과 플랫폼이 네모 마이크로서비스를 자사 제품에 통합했다.

폭넓은 생태계 연계

네모 마이크로서비스는 라마, 파이, 젬마, 미스트랄 등 주요 오픈모델과 통합되며, 크루AI, 랭체인, 라마스택 등 다양한 에이전트 프레임워크에서 사용 가능하다. 메타는 네모 마이크로서비스를 자사 라마스택에 통합하여 모델 최적화와 운영 효율성을 높이고 있다. 엔비디아 인증 인프라를 기반으로, Dell, HPE, IBM 등 주요 스토리지 및 서버 파트너와의 연계도 강화됐다.

메타의 AI 소프트웨어 엔지니어 라고담 머시(Raghotham Murthy)는 “네모 마이크로서비스 기반 데이터 플라이휠을 통해 모델 정확도와 효율성을 개선하고, 총소유비용을 절감할 수 있다”고 밝혔다. 엔비디아는 향후 NGC 카탈로그를 통해 API 기반의 장기 지원 버전을 제공하며, 개발자들이 안정적이고 보안이 강화된 AI 환경을 구현할 수 있도록 지속 지원할 계획이다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지