AI 추론 워크로드가 고도화되면서 기업은 성능과 비용, 안정성을 동시에 충족하는 플랫폼을 요구하고 있다. 기존에는 고성능 AI 추론을 위해 엔비디아 GPU 기반 솔루션이 주로 활용됐으나, 높은 구독 비용과 제한된 선택지가 기업의 부담으로 작용했다. 특히 LLM(대규모 언어모델)과 같은 복잡한 생성AI 모델은 대규모 데이터 처리와 낮은 지연성을 필요로 하며, 프라이버시와 보안까지 고려해야 하는 환경에서 다양한 대안이 필요하다. 이러한 상황에서 CPU와 GPU를 결합한 통합형 AI 추론 플랫폼은 워크스테이션과 에지 애플리케이션 전반에서 기업이 빠르게 대응하고 경쟁력을 확보하는 핵심 기반으로 떠오르고 있다.
인텔(Intel, CEO 팻 겔싱어 Pat Gelsinger)은 ML커먼스(MLCommons)가 발표한 MLPerf 추론 v5.1 벤치마크 결과를 공개하며 자사의 인텔 제온 6(Xeon 6) 프로세서와 인텔 아크 프로 B60(Arc Pro B60) GPU 기반 시스템이 워크스테이션과 에지 환경에서 뛰어난 성능을 입증했다고 밝혔다.

테스트 결과 아크 프로 B60은 라마(Llama)4 80B 모델 추론 처리량에서 경쟁사 대비 최대 4배의 가격 대비 성능을 기록했다. 인텔은 이를 통해 GPU와 CPU를 아우르는 풀스택 플랫폼 역량을 강화하며 AI 추론 분야에서 새로운 선택지를 제공하고 있다.
코드명 ‘프로젝트 배틀매트릭스(Project Battlematrix)’로 알려진 인텔 GPU 시스템은 올인원(all-in-one) AI 추론 플랫폼으로 설계됐다. 이 시스템은 검증된 하드웨어와 소프트웨어 스택을 통합해 복잡한 추론 워크로드에도 즉시 적용 가능하며, 리눅스(Linux) 환경에서 컨테이너 기반 배포로 도입과 운영을 단순화했다. 또한 멀티 GPU 스케일링과 PCle P2P 데이터 전송 최적화를 통해 높은 처리량과 낮은 지연성을 실현한다.
아크 프로 B-시리즈 GPU는 ECC, SRIOV, 텔레메트리(telemetry), 원격 펌웨어 업데이트 등 엔터프라이즈급 관리 기능을 지원하며, 기업 환경에서 보안성과 신뢰성을 확보했다. 이는 AI 추론 워크로드를 대규모로 운영하는 금융, 제조, 의료 등 다양한 산업군에서 중요하게 평가되는 요소다.
CPU의 역할도 강화됐다. 인텔 제온은 데이터 전처리와 워크로드 오케스트레이션을 담당하며 GPU 기반 시스템의 성능을 극대화한다. 특히 P코어를 탑재한 제온 6는 MLPerf 추론 v5.1에서 이전 세대 대비 1.9배 향상된 성능을 기록했다. 인텔은 MLPerf에 서버 CPU 벤치마크를 제출하는 유일한 기업으로, CPU와 GPU 아키텍처 전반에 걸친 AI 리더십을 입증했다.
이전까지는 독점적 모델 기반의 비용 구조로 인해 기업들이 대규모 언어모델 배포에 어려움을 겪었지만, 아크 프로 B-시리즈 GPU와 제온 6의 조합은 합리적 가격과 확장성, 보안성을 동시에 제공하며 새로운 대안을 마련했다. 이로써 기업은 AI 추론 워크로드의 효율성과 접근성을 높여 디지털 전환 가속화에 기여할 수 있다.
인텔 소프트웨어, GPU 및 NPU IP 그룹 총괄 리사 피어스(Lisa Pearce)는 “MLPerf v5.1 결과는 인텔의 GPU 및 AI 전략을 강력히 입증한다. 아크 프로 B-시리즈 GPU는 강력하면서도 사용하기 쉬운 합리적인 추론 워크스테이션으로 기업의 경쟁력을 높여준다”고 말했다.
인텔은 향후 프로젝트 배틀매트릭스를 기반으로 다양한 산업군에서 AI 추론 워크로드 최적화와 보안 강화에 집중한다는 계획이다. 또한 글로벌 CSP 및 에지 솔루션 파트너와의 협업을 확대해 기업 고객의 AI 인프라 현대화를 가속화할 방침이다.
관련기사
- AI 기반 신뢰·연구·보안 플랫폼..기업 신뢰와 성장 동력 강화
- 67.7% 기업이 데이터 손실...기업 생존 위협하는 “보이지 않는 백업”
- 인공일반지능 AGI, 공급망 최적화와 고객 경험 혁신 기회
- AI 고객 경험의 성패, ‘통합·신뢰·인간 협업’이 좌우
- LLM·지능형 에이전트 결합 ‘AI 데이터 애널리스트’...비정형 데이터 5분 만에 인사이트로 전환
- 노코드 AI 에이전트 구축 플랫폼 ‘디딤에이전트빌더’…기업 AI 활용성↑비용↓
- ‘자율 분석 멀티 에이전트 AI’...기업 의사결정 자동화
- AI 임베디드 분석, 실시간 데이터 인텔리전스로 기업 데이터 활용 극대화
- 넷앱-인텔, 통합 AI 추론 솔루션...추론 간소화로 빠른 AI 도입과 비용 절감 효과↑
- 인텔 제온 6 P-코어, 5세대 대비 평균 1.9배 성능 향상
- 델 테크놀로지스, ‘엔비디아 RTX 프로 블랙웰’ 탑재 모바일 워크스테이션 6종 출시
- 사이버링크, 인텔 코어 울트라 프로세서 기반 AI 영상 추출 및 인식 기술 선보인다
- CPU와 GPU 융합, 엔비디아·인텔이 여는 AI 산업 구조 대전환
- 2나노 시대 여는 인텔 18A...팬서 레이크로 AI 연산 재정의
- 인텔, 국내 AI PC 시장 적극 공략...온디바이스 파트너 생태계 확장 가속
