AI 모델 배포와 추론 비용 절감은 기업과 개발자에게 중요한 과제가 되고 있다. 고성능 AI 애플리케이션의 증가로 인해 컴퓨팅 리소스 수요가 급증하고 있으며, 이로 인해 효율적인 인프라 관리와 비용 절감 전략이 필수적으로 요구되고 있다. 특히, AI 모델을 실험하고 배포하는 과정에서 클라우드 환경의 유연성이 강조되고 있으며, 이를 지원하는 솔루션이 필요하다.

AI 클라우드 에이전트 플랫폼 패일블루닷 AI(PaleBlueDot AI)가 AI 모델 배포를 간소화하고 추론 비용을 절감하며 딥시크-R1에 대한 조기 액세스를 제공하도록 설계된 AI 클라우드 에이전트인 ‘Dot-1.1’을 공개했다.

Dot-1.1은 통합된 딥시크 PBD 액세스, 실시간 GPU 가격 책정 및 AI 환경 지도를 통해 개발자가 AI 솔루션을 유연하고 효율적으로 확장할 수 있도록 지원한다. 개발자는 특정 요구 사항을 분석하고 비즈니스 요구와 환경에 맞는 비용 효율적인 GPU 배포 계획을 구상하도록 요청할 수 있다.

사용자는 다양한 딥시크 모델 제품군에 대한 API 액세스를 얻어 사용자 정의 AI 솔루션을 원활하게 배포할 수 있다. 이러한 통합은 개발자가 딥시크 671B에서 AI 애플리케이션을 실험, 구축 및 확장할 수 있도록 지원한다.

또한 민감하거나 기밀 데이터를 처리하는 조직을 위해 개인 클라우드 배포 옵션도 제공해 안전하고 규정을 준수하는 AI 인프라를 보장한다.

한편, 전 세계 특정 지역에서 저렴한 가격으로 적절한 GPU 클러스터를 소싱하는 것은 까다로울 수 있다. 이에 패일블루닷 AI는 고객이 GPU 모델, 지역 또는 배포 규모와 같은 특정 기준에 따라 컴퓨팅 리소스를 검색할 수 있도록 클러스터 마켓플레이스를 만들었다.

클러스터 마켓플레이스 또는 맞춤형 클러스터 요청을 통해 기업은 패일블루닷 AI의 글로벌 컴퓨팅 네트워크를 활용하면서 AI 워크로드를 제어할 수 있다.

한편, 패일블루닷 AI는 업계를 형성하는 모든 주요 기업을 중점으로 산업 특화와 범용 애플리케이션, AI 인프라에 이르기까지 전체 AI 생태계를 다루는 동적 AI 환경 매핑을 만들었다.

패일블루닷 AI의 수석 고문인 스티븐 와츠는 “AI 액세스를 대중화하면서 추론 비용은 연간 최대 85%까지 감소하고 있으며, 이제 오픈 소스의 모든 기능을 통해 딥시크 및 기타 업계 혁신 기업들이 AI 산업에 또 다른 '헨리 포드'의 순간을 가져올 수 있게 되었다.”라며 “이러한 추진력은 컴퓨팅 성능 수요의 기하급수적인 성장을 촉진할 뿐만 아니라 개인과 기업이 AI를 효율적으로 채택해 산업 발전을 가속하도록 지원한다.”라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지