AMD가 AMD 인스팅트(AMD Instinct) 가속기 로드맵을 발표했다. 업데이트된 로드맵은 올 4분기에 출시될 MD 인스팅트 MI325X 가속기부터 시작된다. 이후, 2025년 출시되는 AMD CDNA 4 아키텍처 기반의 AMD 인스팅트 MI350 시리즈로 이어질 예정이다.

이 제품은 AMD CDNA 3 아키텍처 기반의 AMD 인스팅트 MI300 시리즈에 대비 35배 향상된 AI 추론 성능을 제공할 전망이다. 2026년 출시 예정인 AMD 인스팅트 MI400 시리즈는 AMD CDNA "넥스트(Next)" 아키텍처를 기반한다.
AMD ROCm 6 개방형 소프트웨어 스택은 AMD 인스팅트 MI300X 가속기가 거대 언어 모델(LLM)에서 탁월한 성능을 발휘하게 한다. 8개의 AMD 인스팅트 MI300X 가속기와 메타 라마-3(Meta Llama-3) 70B를 구동하는 ROCm 6을 사용하는 서버에서 높은 추론 성능 및 토큰 생성 능력을 제공한다. 또한, ROCm 6이 탑재된 단일 AMD 인스팅트 MI300X 가속기도 미스트랄-7B(Mistral-7B)에서 높은 추론 성능과 토큰 생성 처리량을 제공한다.
AMD는 허깅 페이스(Hugging Face)가 현재 AMD 인스팅트 MI300X 가속기에서 신속하게 작동하는지 확인하고자 매일 밤 가장 많이 활용되는 모델 700,000개에 대한 테스트를 실시하고 있다고 했다. 또한 AMD는 파이토치(PyTorch), 텐서플로우(TensorFlow) 및 JAX와 같은 인기 AI 프레임워크에 대한 업스트림 작업도 지속하고 있다.
AMD 인스팅트 가속기의 연도별 로드맵은 다음과 같다.
288GB의 HBM3E 메모리와 초당 6테라바이트의 메모리 대역폭을 제공하는 AMD 인스팅트 MI325X 가속기는 기존 AMD 인스팅트 MI300 시리즈와 동일한 업계 표준 유니버설 베이스보드(Universal Baseboard) 서버 설계를 기반으로 하며, 2024년 4분기에 출시된다. 이 제품은 경쟁사보다 각각 2배, 1.3배 더 많은 업계 최대의 메모리 용량과 대역폭, 경쟁사보다 1.3배 더 높은 컴퓨팅 성능을 제공한다.
AMD 인스팅트 MI350 시리즈의 첫 번째 제품인 AMD 인스팅트 MI350X 가속기는 AMD CDNA 4 아키텍처를 기반으로 하며 2025년에 출시될 예정이다. 이 제품은 다른 MI300 시리즈 가속기와 동일한 업계 표준 유니버설 베이스보드(Universal Baseboard) 서버 설계를 기반으로 한다. 고급 3nm 공정 기술을 바탕으로 FP4 및 FP6 AI 데이터 유형을 지원하며 최대 288GB의 HBM3E 메모리 탑재한다.
AMD 인스팅트 MI400 시리즈 가속기에 활용되는 AMD CDNA "넥스트" 아키텍처는 2026년 출시 예정이며, 추론 및 대규모 AI 훈련을 위한 추가적인 성능 및 효율성을 구현을 지원하는 최신 기능을 제공한다.
브래드 맥크레디(Brad McCredie) AMD 데이터 센터 가속 컴퓨트 부문의 부사장은 "AMD 인스팅트 MI300X 가속기는 마이크로소프트 애저(Microsoft Azure), 메타(Meta), 델 테크놀로지스(Dell Technologies), HPE, 레노버(Lenovo) 등 수많은 파트너 및 고객의 선택을 받고 있다."라며, "업데이트된 제품 개발 계획에 따라, 우리는 AI 업계와 고객이 데이터 센터 AI 훈련 및 추론 분야의 발전을 위해 필요로 하는 선도적인 성능과 기능 제공하고자 지속 혁신해 나갈 예정이다."라고 밝혔다.
관련기사
- 컴퓨텍스 2024, AI가 연결하는 세상을 만나다
- 엔비디아 대항마 기술 나오나
- ‘에지 AI 하드웨어 시장’ 웨어러블·스마트홈 인기타고 순항 중
- 우주 탐사에 유용한 내방사선 다목적 디바이스
- 슈퍼마이크로, HPC 및 AI 환경 최적화 수냉식 고성능 서버 라인업 선봬
- AMD, 저전력·고효율 '라이젠 7 8700F 및 8400F 프로세서' 출시
- 개인화·맞춤형 네트워크 서비스 급증 ‘네트워크 슬라이싱’ 시장, 연평균 51.7% 광폭 성장
- AMD 4세대 에픽·라이젠 8000 시리즈 프로세서 증가세
- 증가하는 온디바이스 AI, 칩셋 개발 박차
- 레노버-AMD, 하이브리드 AI 동맹…에지에서 클라우드까지 컴퓨팅 혁신
- [Success Story] 초저지연 거래 플랫폼 옵티버 데이터 센터가 선택한 AI컴퓨팅 솔루션
- 생성AI가 부채질하는 AI 데이터센터 인프라 수요
- [컴퓨텍스 2024] 기업과 컴퓨팅 혁신하는 ‘AI 기반' 가속기·프로세서·에지
- 생성AI 산업혁명 앞장선 ‘HPE 기반 엔비디아 AI 컴퓨팅 포트폴리오’
- 가상화 기능 강화된 'HPE 프라이빗 클라우드'...고성능·고가용성 향상
- 한국레노버, AI 노트북 ‘최대 26%’ 할인 이벤트 진행
- 개인과 기업에 맞는 AI PC는?
- 한국레노버, ‘AI 노트북 요가시리즈’ 전 라인업 선봬
- 한국레노버, 엔터테인먼트 태블릿 ‘탭 플러스’ 출시
- HPE, ESG 여정 점검한 ‘2023 리빙 프로그레스 리포트’ 발간
- AMD, ‘사일로 AI’ 인수로 기업용 AI 시장 확대
- 델 데이터 레이크하우스에 추가된 ‘워프 스피드’...성능과 비용 동시 만족
- AMD 플루이드 모션 프레임 2 테크니컬 프리뷰 공개
- 최태원 회장 “HBM 넘어 AI 시대 미래사업 경쟁력 강화해야”
- ‘레노버 하이브리드 클라우드 컨설팅 서비스’ 빠르고 효율적인 하이브리드 클라우드 현대화 구축 지원
