생성AI의 급격한 확산으로 GPU 서버 사용이 급증했다. 이러한 서버는 고급 병렬 컴퓨팅을 통해 대규모 학습 및 추론 프로세스를 향상해 더 빠르고 정확한 콘텐츠 생성을 가능하게 한다.

그 결과 다양한 산업 분야의 기업들이 GPU 서버 도입 및 활용을 가속하고 있다. 그러나 수요 증가로 인해 기업들은 GPU 서버 사용에 대한 가시성 및 최적화 부족으로 인한 투자 수익률 저하됐다

또한 여러 위치에 분산된 다수의 GPU 서버에 대한 단편적인 관리로 인한 낮은 활용률, 내부 부서 간 비효율적인 자원 공유로 인한 서버 유휴 상태 발생, 비피크 시간대에 잉여 GPU 자원을 외부 기업에 임대할 수단 부재 등 기업들은 여러 가지 문제에 직면해 있다.

컴퓨팅 인프라 솔루션 제공 기업 모겐로트(Morgenrot)가 AI 데이터 센터를 위한 가상화된 오케스트레이션 플랫폼 ‘모겐로트 테일러노드(MORGENROT TailorNode)’를 출시했다.

모겐로트 테일러로드는 프라이빗 GPU 클라우드 인프라 구축, 온프레미스 서버 중앙 관리, 회사 또는 그룹 내 컴퓨팅 자원 공유, 외부 기업에 컴퓨팅 파워 임대까지 가능하게 하는 가상화된 오케스트레이션 플랫폼이다.

이 플랫폼 서비스를 도입함으로 기업은 단일 사이트 또는 여러 분산된 위치의 AI 데이터 센터 전반에서 GPU 단위로 컴퓨팅 자원을 가상화할 수 있다.

주요 기능으로 ▲컴퓨팅 자원의 중앙 집중식 관리 ▲가상화 기반 자원 할당 ▲작업 기반 서버 관리 ▲다부서 및 다지역 자원 공유 ▲잉여 GPU 자원 외부 임대 ▲예약 및 포인트 기반 요금 시스템 ▲실시간 모니터링 등을 지원한다.

GPU 서버 및 AI 데이터 센터 관리를 통합해 효율적인 운영을 지원하며, 자체 가상화 기술을 통해 물리적 GPU 서버를 단일 GPU 단위의 가상 자원으로 나눈다. 또한 작업 단위별 사용량을 추적하고 통계 분석을 통해 운영을 최적화한다.

GPUaaS(GPU as a Service)를 통해 여러 사용자가 동시에 GPU 자원을 활용할 수 있도록 지원하며, 남는 컴퓨팅 자원을 외부 기업에 제공해 활용률을 높인다.

한편, 유연한 사용 관리를 위한 예약 기능과 포인트 기반 요금 시스템을 포함하며, 시스템 성능을 지속적으로 모니터링하고 이상 발생 시 사용자에게 알림을 제공한다.

모겐로트 테일러로드는 향후 ▲작업 기반 GPU 전력 소비 시각화 ▲전력 사용량 기반 CO2 배출량 추적 ▲신재생 에너지를 포함한 에너지원 모니터링 등의 기능들을 추가할 예정이다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지