생성AI, 초거대 언어모델(LLM), 멀티모달 AI 등 대규모 연산을 요구하는 기술의 확산으로 인해 고성능 GPU 인프라에 대한 수요가 빠르게 증가하고 있다. 특히 GPT-4, 클로드, 제미나이와 같은 LLM을 학습 및 추론하기 위한 대용량 메모리와 고속 연산 환경이 필수로 부각되고 있으며, 이러한 기술은 단순 AI 스타트업을 넘어 대기업, 공공기관, 연구기관 등 전 산업 분야에서 핵심 인프라로 자리잡고 있다. 이에 따라 클라우드 기반으로 고성능 GPU를 제공하는 서비스형 GPU(GPUaaS) 모델이 주목받고 있으며, 고비용 장비 도입 부담을 줄이면서도 유연한 리소스 활용을 가능하게 한다.
양자컴퓨팅 연구개발 및 AI 인프라 운영 전문 기업인 한국퀀텀컴퓨팅(Korea Quantum Computing, 이하 KQC)이 7월 4일부터 부평에 위치한 디지털에지(Digital Edge) 데이터센터에 구축한 엔비디아(NVIDIA) H200 GPU 기반의 AI GPU 팜을 통해 클라우드형 고성능 컴퓨팅 서비스인 GPUaaS를 공식 발표했다.

KQC는 초거대 언어모델, 생성AI, 멀티모달 AI 등 최신 AI 시장의 수요에 맞춰 고성능·고효율 GPU 인프라를 제공하고, 고객들이 직접 물리 서버 환경처럼 운영체제를 설치·제어하며 안정적인 성능을 활용할 수 있도록 한다. 특히 KQC의 GPUaaS는 클라우드를 통해 유연하게 컴퓨팅 자원을 활용하고자 하는 국내 기업과 기관을 주요 고객층으로 삼고 있다.
엔비디아 H200 기반 고도화된 AI 연산 최적화 인프라
KQC의 AI GPU 팜은 엔비디아 호퍼(Hopper) 아키텍처 기반의 H200 GPU를 병렬로 구성한 고성능 클러스터 형태로, 초거대 연산 처리에 최적화되어 있다. H200 GPU는 이전 세대인 H100 대비 메모리 용량과 속도에서 획기적으로 향상되었으며, Transformer Engine을 내장하여 LLM 훈련과 추론 효율을 극대화한다.
이 인프라는 GPT-4, 클로드, 제미나이 등과 같은 LLM, 생성AI 모델, 복잡한 시뮬레이션, 고성능 데이터 분석 등 다양한 연산 집약적 워크로드에 대응한다. KQC는 해당 서비스를 통해 빅테크 기업, AI 스타트업, 복잡한 계산을 요구하는 산업군, 국가 연구기관, HPC 센터 등에 최적화된 인프라를 제공한다.
김준영(Kim Junyoung) 대표는 “KQC의 GPU 팜은 고성능 연산 인프라를 안정적이고 합리적인 가격으로 제공해 AI 및 HPC 산업 수요를 충족시킬 것”이라며, “향후 양자컴퓨팅 인프라와 연계한 고도화된 서비스도 선보일 계획”이라고 밝혔다.
다양한 기능과 유연한 과금 체계
KQC의 GPUaaS는 GPU 가상화 및 공유 기능을 통해 다수의 사용자가 동시에 효율적으로 리소스를 사용할 수 있으며, 엔비디아 AI Enterprise 소프트웨어 스택이 포함되어 있어 최신 기술 기반의 개발과 운영 환경을 제공한다.
또한 사용자는 컴퓨팅, 스토리지, 네트워크 리소스를 필요에 따라 탄력적으로 조정할 수 있으며, 종량제 과금 방식으로 초기 투자 부담 없이 경제적으로 서비스를 이용할 수 있다. 아울러 예측 분석 기능을 통해 예산 관리 효율을 높이고, 인프라 모니터링, 자동 배포, 업데이트 기능을 통해 운영 편의성과 안정성을 확보할 수 있다.
이번 서비스를 총괄한 김창회(Kim Changhoe) 전무는 “서비스의 안정성과 비용 경쟁력 측면에서 매우 강력한 솔루션이 될 것”이라며, “시장 수요에 맞춰 다양한 시스템을 지속적으로 확대할 계획”이라고 밝혔다.
관련기사
- 슈나이더 일렉트릭-엔비디아, 지속 가능한 AI 팩토리 인프라 개발 맞손
- “AI 열풍에 데이터센터 전력 폭주...전력·냉각·규제 대응 시급”
- “AI 데이터센터 전력, 2035년 30배 증가 전망”...기술·규제 혁신과 산업 간 협력으로 대응
- 500MW급 재생에너지 기반 초대형 ‘AI 데이터센터’ 구축 사업...네이버클라우드도 참여
- 5분 만에 배포하는 ‘AI 데이터센터 플랫폼’...데이터 주권도 강화
- 슈나이더 일렉트릭 코리아-엘리스그룹, AI 데이터센터 및 모듈형 인프라 고도화 협력
- [컴퓨텍스 2025] 슈퍼마이크로, 모듈형 수랭식 AI 데이터센터 솔루션 공개...에너지 절감 및 TCO 최적화
- [컴퓨텍스 2025] 악시아도, AI 기반 ‘메모리·스토리지·보안 통합 단일 칩’ 공개
- “슈나이더 일렉트릭, 에너지 효율 극대화·운영 비용 절감·ESG 경영 실현 해법 ‘전기화 4.0’ 이끈다”
- AI 데이터 센터 열관리 해결하는 '슈나이더 일렉트릭 쿨링 솔루션'
- 세계 최대 규모 100% 친환경 자체 전력 운영 데이터센터 허브
- SiC 기반 SPM 31 ‘지능형 전력 모듈’...에너지 소비·시스템 비용 절감
- 128TB 지원 고성능·고용량 ‘PCIe Gen5 SSD’ 개발 키트...AI 데이터센터·에지 서버 애플리케이션에 적합
- AI 네이티브 네트워킹으로 GPUaaS와 AIaaS의 효율 극대화
- ITOps에 통합된 AI 추론 기술...“AI 데이터센터 운영 혁신”
- LG CNS-코히어, 보안성·추론력 강화한 1110억 파라미터 LLM 개발
- 한국퀀텀컴퓨팅-KIOST, 양자컴퓨팅·AI로 해양환경 예측 고도화 맞손
- 미루웨어-인피니틱스, AI 인프라 통합 기술 및 업무 협력
- 한국퀀텀컴퓨팅-크립토포에이, 국산 양자내성암호 기반 보안 솔루션 상용화 맞손
- 옥스믹 랩스, 모듈형 GPU IP 공개...AI 에이전트 최적화 풀스택 설계 선언
- AI 연산 최적화 필수 인프라 GPUaaS ‘AI GPU 팜’
- ‘확장 가능한 GPU 클라우드 GPUaaS’...AI 학습·추론·RAG 성능 강화
- HS효성인포메이션시스템, ‘데이터센터 현대화 컨퍼런스 2025’ 개최...AI 전환 인프라 전략 제시
- GPU 수익화율 30%↑·판매 주기 40%↓...AI 인프라 시장의 새 성장 방정식
- 한국퀀텀컴퓨팅-한국생명정보학회, 양자컴퓨팅 기반 바이오 연구 협력
- 한국퀀텀컴퓨팅-퀀텀에이아이, 고부가가치 AI 서비스 개발 협력
