생성AI, 초거대 언어모델(LLM), 멀티모달 AI 등 대규모 연산을 요구하는 기술의 확산으로 인해 고성능 GPU 인프라에 대한 수요가 빠르게 증가하고 있다. 특히 GPT-4, 클로드, 제미나이와 같은 LLM을 학습 및 추론하기 위한 대용량 메모리와 고속 연산 환경이 필수로 부각되고 있으며, 이러한 기술은 단순 AI 스타트업을 넘어 대기업, 공공기관, 연구기관 등 전 산업 분야에서 핵심 인프라로 자리잡고 있다. 이에 따라 클라우드 기반으로 고성능 GPU를 제공하는 서비스형 GPU(GPUaaS) 모델이 주목받고 있으며, 고비용 장비 도입 부담을 줄이면서도 유연한 리소스 활용을 가능하게 한다.

양자컴퓨팅 연구개발 및 AI 인프라 운영 전문 기업인 한국퀀텀컴퓨팅(Korea Quantum Computing, 이하 KQC)이 7월 4일부터 부평에 위치한 디지털에지(Digital Edge) 데이터센터에 구축한 엔비디아(NVIDIA) H200 GPU 기반의 AI GPU 팜을 통해 클라우드형 고성능 컴퓨팅 서비스인 GPUaaS를 공식 발표했다.

한국퀀텀컴퓨팅의 AI 데이터센터
한국퀀텀컴퓨팅의 AI 데이터센터

KQC는 초거대 언어모델, 생성AI, 멀티모달 AI 등 최신 AI 시장의 수요에 맞춰 고성능·고효율 GPU 인프라를 제공하고, 고객들이 직접 물리 서버 환경처럼 운영체제를 설치·제어하며 안정적인 성능을 활용할 수 있도록 한다. 특히 KQC의 GPUaaS는 클라우드를 통해 유연하게 컴퓨팅 자원을 활용하고자 하는 국내 기업과 기관을 주요 고객층으로 삼고 있다.

엔비디아 H200 기반 고도화된 AI 연산 최적화 인프라

KQC의 AI GPU 팜은 엔비디아 호퍼(Hopper) 아키텍처 기반의 H200 GPU를 병렬로 구성한 고성능 클러스터 형태로, 초거대 연산 처리에 최적화되어 있다. H200 GPU는 이전 세대인 H100 대비 메모리 용량과 속도에서 획기적으로 향상되었으며, Transformer Engine을 내장하여 LLM 훈련과 추론 효율을 극대화한다.

이 인프라는 GPT-4, 클로드, 제미나이 등과 같은 LLM, 생성AI 모델, 복잡한 시뮬레이션, 고성능 데이터 분석 등 다양한 연산 집약적 워크로드에 대응한다. KQC는 해당 서비스를 통해 빅테크 기업, AI 스타트업, 복잡한 계산을 요구하는 산업군, 국가 연구기관, HPC 센터 등에 최적화된 인프라를 제공한다.

김준영(Kim Junyoung) 대표는 “KQC의 GPU 팜은 고성능 연산 인프라를 안정적이고 합리적인 가격으로 제공해 AI 및 HPC 산업 수요를 충족시킬 것”이라며, “향후 양자컴퓨팅 인프라와 연계한 고도화된 서비스도 선보일 계획”이라고 밝혔다.

다양한 기능과 유연한 과금 체계

KQC의 GPUaaS는 GPU 가상화 및 공유 기능을 통해 다수의 사용자가 동시에 효율적으로 리소스를 사용할 수 있으며, 엔비디아 AI Enterprise 소프트웨어 스택이 포함되어 있어 최신 기술 기반의 개발과 운영 환경을 제공한다.

또한 사용자는 컴퓨팅, 스토리지, 네트워크 리소스를 필요에 따라 탄력적으로 조정할 수 있으며, 종량제 과금 방식으로 초기 투자 부담 없이 경제적으로 서비스를 이용할 수 있다. 아울러 예측 분석 기능을 통해 예산 관리 효율을 높이고, 인프라 모니터링, 자동 배포, 업데이트 기능을 통해 운영 편의성과 안정성을 확보할 수 있다.

이번 서비스를 총괄한 김창회(Kim Changhoe) 전무는 “서비스의 안정성과 비용 경쟁력 측면에서 매우 강력한 솔루션이 될 것”이라며, “시장 수요에 맞춰 다양한 시스템을 지속적으로 확대할 계획”이라고 밝혔다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지