AI 학습과 추론 수요가 급증하면서 기업들은 고성능 GPU 인프라를 효율적으로 확보하는 데 어려움을 겪고 있다. 특히 초기 도입 비용이 큰 장비 구매 대신, 필요할 때 즉시 확장 가능한 GPU 클라우드 서비스에 대한 요구가 높아지고 있다. 연구기관, 스타트업, 대기업 모두 복잡한 운영 부담 없이 유연하게 GPU를 활용할 수 있는 솔루션이 필요한 상황이다.
AI·데이터센터·사물인터넷 솔루션 기업 디후니(Dihuni)가 GPU 클라우드 플랫폼을 정식 공개했다고 밝혔다. 이번 서비스는 자사 브랜드로 리브랜딩한 큐브리드AI(Qubrid AI) 플랫폼을 기반으로 GPUaaS(GPU as a Service)와 AI 툴을 통합 제공한다.
AI 워크로드 최적화 기능
이번 서비스는 온디맨드 GPU 클라우드 컴퓨트, 장기 GPU 서버 임대, AI 추론 파이프라인, 엔터프라이즈급 RAG(검색 증강 생성) 기능을 포함한다. 사용자는 고급 GPU 가상머신을 즉시 활용해 AI 학습과 파인튜닝, HPC 워크로드를 처리할 수 있으며, 월 단위 또는 연 단위로 베어메탈 서버를 임대해 장기 프로젝트를 운영할 수 있다.

추론 파이프라인 기능은 실사용 환경에서 AI 모델을 확장 가능하게 배포하고 최적화할 수 있도록 지원한다. 또한 RAG 기능은 지식 검색과 생성AI를 결합해 맥락 기반의 정확도 높은 결과를 제공한다. 이를 통해 엔터프라이즈 환경에서 신뢰성 있는 생성AI 활용이 가능하다.
하이브리드·투명성·전용 GPU 제공
고객은 클라우드와 온프레미스 중 선택해 워크로드를 실행하거나, 하이브리드 방식으로 배치할 수 있다. 큐브리드AI의 컨트롤러 소프트웨어를 통해 유연성과 데이터 제어권을 확보할 수 있으며, 디후니는 GPU를 과다 할당하지 않고 전용 자원을 보장해 성능 저하 문제를 방지한다. 이는 전통적인 하이퍼스케일 환경에서 겪는 지연과 불투명성을 해결하는 차별점이다.
디후니는 GPU 클라우드를 통해 고객이 턴키 AI 템플릿, 엔터프라이즈급 인프라, 성능 최적화 환경을 활용해 AI 혁신을 가속할 수 있도록 지원한다. 이를 통해 기업은 복잡한 초기 세팅 없이 신속하게 AI 프로젝트를 시작하고, 시장 출시 시간을 단축할 수 있다.
관련기사
- AI 연산 최적화 필수 인프라 GPUaaS ‘AI GPU 팜’
- 배스트 데이터-SK텔레콤, 엔비디아 블랙웰 기반 소버린 AI 인프라 최적화
- 한국퀀텀컴퓨팅, 고성능 AI GPUaaS로 본격 AI 인프라 시장 진출
- 인텔, ‘2025 인텔 AI 서밋 서울’ 성료
- AWS, 과기정통부 ‘AI 연구용 컴퓨팅 지원 프로젝트’서 클라우드 인프라 제공
- KQC, ‘퀀텀코리아 2025’서 풀스택 양자 서비스·GPUaaS 공개
- 웨카-네비우스, GPUaaS 기반 AI 인프라 협력...네오클라우드로 초고속 훈련·추론 지원
- AI 하드웨어 시장을 평준화하는 GPUaaS
- 큐브리드, 쿠버네티스 환경 DB 자동화 ‘큐브리드 오퍼레이터’ 출시
- 에이아이브, 36억 규모 클라우드 기반 ‘고난이도 AX 연구지원 플랫폼 구축’ 사업 수주
- GPU 수익화율 30%↑·판매 주기 40%↓...AI 인프라 시장의 새 성장 방정식
- GPU 한계 넘어선 LPU 아키텍처, 실시간 AI 추론 5배 향상
- 글로벌 서버 장애에도 100% 가동...베어메탈·분산 로드밸런싱으로 175개 블록체인 RPC 무중단
- GPU 자원 효율 2배 높인 에이아이브 ‘에어클라우드’, 실리콘밸리서 기술력 입증
- GPU 비용 70% 줄이고 성능 안정화…AI 인프라 자동 최적화 기술 부상
