‘확장 가능한 GPU 클라우드 GPUaaS’...AI 학습·추론·RAG 성능 강화

AI 학습과 추론 수요가 급증하면서 기업들은 고성능 GPU 인프라를 효율적으로 확보하는 데 어려움을 겪고 있다. 특히 초기 도입 비용이 큰 장비 구매 대신, 필요할 때 즉시 확장 가능한 GPU 클라우드 서비스에 대한 요구가 높아지고 있다. 연구기관, 스타트업, 대기업 모두 복잡한 운영 부담 없이 유연하게 GPU를 활용할 수 있는 솔루션이 필요한 상황이다.

AI·데이터센터·사물인터넷 솔루션 기업 디후니(Dihuni)가 GPU 클라우드 플랫폼을 정식 공개했다고 밝혔다. 이번 서비스는 자사 브랜드로 리브랜딩한 큐브리드AI(Qubrid AI) 플랫폼을 기반으로 GPUaaS(GPU as a Service)와 AI 툴을 통합 제공한다.

AI 워크로드 최적화 기능

이번 서비스는 온디맨드 GPU 클라우드 컴퓨트, 장기 GPU 서버 임대, AI 추론 파이프라인, 엔터프라이즈급 RAG(검색 증강 생성) 기능을 포함한다. 사용자는 고급 GPU 가상머신을 즉시 활용해 AI 학습과 파인튜닝, HPC 워크로드를 처리할 수 있으며, 월 단위 또는 연 단위로 베어메탈 서버를 임대해 장기 프로젝트를 운영할 수 있다.

추론 파이프라인 기능은 실사용 환경에서 AI 모델을 확장 가능하게 배포하고 최적화할 수 있도록 지원한다. 또한 RAG 기능은 지식 검색과 생성AI를 결합해 맥락 기반의 정확도 높은 결과를 제공한다. 이를 통해 엔터프라이즈 환경에서 신뢰성 있는 생성AI 활용이 가능하다.

하이브리드·투명성·전용 GPU 제공

고객은 클라우드와 온프레미스 중 선택해 워크로드를 실행하거나, 하이브리드 방식으로 배치할 수 있다. 큐브리드AI의 컨트롤러 소프트웨어를 통해 유연성과 데이터 제어권을 확보할 수 있으며, 디후니는 GPU를 과다 할당하지 않고 전용 자원을 보장해 성능 저하 문제를 방지한다. 이는 전통적인 하이퍼스케일 환경에서 겪는 지연과 불투명성을 해결하는 차별점이다.

디후니는 GPU 클라우드를 통해 고객이 턴키 AI 템플릿, 엔터프라이즈급 인프라, 성능 최적화 환경을 활용해 AI 혁신을 가속할 수 있도록 지원한다. 이를 통해 기업은 복잡한 초기 세팅 없이 신속하게 AI 프로젝트를 시작하고, 시장 출시 시간을 단축할 수 있다.

[알림] 글로벌 번역 전문 기업 딥엘(DeepL)이 오는 9월 24일 오후 2시부터 3시까지 GTT SHOW의 GTT Webinar 플랫폼을 통해 ‘대량 데이터 번역 품질을 한 단계 높이는 DeepL API 활용 전략’을 주제로 무료 웨비나를 개최한다. 이 웨비나에서는 딥엘 API의 고급 기능과 실제 비즈니스 현장 적용 전략을 구체적으로 다루며, 글로벌 커뮤니케이션 경쟁력을 높일 수 있는 실질적인 해법을 제시한다.

김은비 기자 eunbi@gttkorea.com

기자의 다른기사

상단영역

본문영역

‘확장 가능한 GPU 클라우드 GPUaaS’...AI 학습·추론·RAG 성능 강화

디후니, 큐브리드AI 기술 기반 GPU 클라우드 서비스 공개
온디맨드·장기 서버 임대·하이브리드 배포·RAG 통합 지원

관련기사

본문영역

키워드

관련기사