AI 모델 배포와 추론 비용 절감은 기업과 개발자에게 중요한 과제가 되고 있다. 고성능 AI 애플리케이션의 증가로 인해 컴퓨팅 리소스 수요가 급증하고 있으며, 이로 인해 효율적인 인프라 관리와 비용 절감 전략이 필수적으로 요구되고 있다. 특히, AI 모델을 실험하고 배포하는 과정에서 클라우드 환경의 유연성이 강조되고 있으며, 이를 지원하는 솔루션이 필요하다.
AI 클라우드 에이전트 플랫폼 패일블루닷 AI(PaleBlueDot AI)가 AI 모델 배포를 간소화하고 추론 비용을 절감하며 딥시크-R1에 대한 조기 액세스를 제공하도록 설계된 AI 클라우드 에이전트인 ‘Dot-1.1’을 공개했다.
Dot-1.1은 통합된 딥시크 PBD 액세스, 실시간 GPU 가격 책정 및 AI 환경 지도를 통해 개발자가 AI 솔루션을 유연하고 효율적으로 확장할 수 있도록 지원한다. 개발자는 특정 요구 사항을 분석하고 비즈니스 요구와 환경에 맞는 비용 효율적인 GPU 배포 계획을 구상하도록 요청할 수 있다.
사용자는 다양한 딥시크 모델 제품군에 대한 API 액세스를 얻어 사용자 정의 AI 솔루션을 원활하게 배포할 수 있다. 이러한 통합은 개발자가 딥시크 671B에서 AI 애플리케이션을 실험, 구축 및 확장할 수 있도록 지원한다.

또한 민감하거나 기밀 데이터를 처리하는 조직을 위해 개인 클라우드 배포 옵션도 제공해 안전하고 규정을 준수하는 AI 인프라를 보장한다.
한편, 전 세계 특정 지역에서 저렴한 가격으로 적절한 GPU 클러스터를 소싱하는 것은 까다로울 수 있다. 이에 패일블루닷 AI는 고객이 GPU 모델, 지역 또는 배포 규모와 같은 특정 기준에 따라 컴퓨팅 리소스를 검색할 수 있도록 클러스터 마켓플레이스를 만들었다.
클러스터 마켓플레이스 또는 맞춤형 클러스터 요청을 통해 기업은 패일블루닷 AI의 글로벌 컴퓨팅 네트워크를 활용하면서 AI 워크로드를 제어할 수 있다.
한편, 패일블루닷 AI는 업계를 형성하는 모든 주요 기업을 중점으로 산업 특화와 범용 애플리케이션, AI 인프라에 이르기까지 전체 AI 생태계를 다루는 동적 AI 환경 매핑을 만들었다.
패일블루닷 AI의 수석 고문인 스티븐 와츠는 “AI 액세스를 대중화하면서 추론 비용은 연간 최대 85%까지 감소하고 있으며, 이제 오픈 소스의 모든 기능을 통해 딥시크 및 기타 업계 혁신 기업들이 AI 산업에 또 다른 '헨리 포드'의 순간을 가져올 수 있게 되었다.”라며 “이러한 추진력은 컴퓨팅 성능 수요의 기하급수적인 성장을 촉진할 뿐만 아니라 개인과 기업이 AI를 효율적으로 채택해 산업 발전을 가속하도록 지원한다.”라고 말했다.
관련기사
- AI 네이티브 네트워킹으로 GPUaaS와 AIaaS의 효율 극대화
- “AI API, 연평균 32.2% 쾌속 성장”...‘AI 자동화·생성AI·사전 훈련 모델’ 수요 증가가 견인
- 딥시크 공격 막는 '기업용 모바일 AI 방어 플랫폼'
- 팔로알토 네트웍스, 딥시크에서 보안 취약점 발견
- 몬드리안AI, GPU 클라우드 플랫폼에 딥시크-R1 모델 지원
- 이스트소프트, AI 검색 엔진 ‘앨런’에 딥시크-R1 적용
- AI ROI 극대화, ‘프로세스 인텔리전스’로 해결
- 스노우플레이크, 코텍스 AI에서 딥시크-R1 지원
- [2025년 전망] 한국을 주도할 5대 IT 인프라 기술 트렌드
- AI 투자 극대화 핵심 “견고하고 지속가능한 인프라”
- 오픈 소스 AI 모델 ‘잠바 1.6’...장문 처리 성능 속도·정확도·보안↑
- 차세대 자동화 혁신하는 ‘AI 에이전트 마켓플레이스’
- 대기업 47%, 고객 대신 행동하는 '에이전트 AI'에 긍정적
- AI 데이터 센터 ‘가상화 오케스트레이션 플랫폼’...컴퓨팅 인프라 최적화
- AI 설계 자동화 플랫폼...코딩 없이 복잡한 앱 개발, 몇 시간 만에 뚝딱!
- 비전문가도 쉽게 웹·모바일 앱 개발하는 '노코드 AI 개발 플랫폼'...개발 비용↓출시 속도↑
- 코딩 생성·콘텐츠 조정 탑재한 실시간 AI 앱 개발 플랫폼
