AI 컴퓨팅 기술 업체인 엔비디아(NVIDIA)가 초고성능 생성AI 성능을 위한 지포스 RTX 슈퍼(GeForce RTX SUPER) 데스크톱 GPU, 주요 제조 업체의 새로운 AI 노트북, 새로운 엔비디아 RTX로 가속화된 AI 소프트웨어와 툴을 발표했다.
여기에는 텍스트-이미지 워크플로를 지원하는 ‘스테이블 디퓨전 XL(Stable Diffusion XL)’의 엔비디아 텐서 RT(TensorRT) 가속, 생성AI 텍스처 툴이 포함된 엔비디아 RTX 리믹스(RTX Remix), DLSS 3 프레임 제너레이션(Frame Generation)을 사용하는 게임과 엔비디아 ACE 마이크로서비스가 포함된다.
AI 개발자를 위한 통합 툴킷인 엔비디아 AI 워크벤치(AI Workbench)는 이달 말 베타 버전으로 출시될 예정이다. 또한 최신 대형 언어 모델(LLM)의 추론 성능을 가속화하고 최적화하는 오픈소스 라이브러리인 엔비디아 텐서RT-LLM(TensorRT-LLM)은 PC에 더 많은 사전 최적화된 모델을 지원한다. 이번 달에 출시되는 엔비디아의 기술 데모 챗 위드 RTX(Chat with RTX)는 텐서RT-LLM의 가속화를 통해 AI 애호가들이 자신의 메모, 문서, 기타 콘텐츠와 상호 작용할 수 있도록 지원한다.

RTX AI PC와 워크스테이션
엔비디아 RTX GPU의 텐서 코어는 가장 복잡한 업무용, 엔터테인먼트용 애플리케이션에서 AI 성능을 크게 향상시킨다.
새로운 지포스 RTX 40 슈퍼 시리즈 그래픽 카드는 최고의 AI 성능을 위한 지포스 RTX 4080 슈퍼(SUPER), 4070 Ti 슈퍼와 4070 슈퍼를 포함한다. 지포스 RTX 4080 슈퍼는 지포스 RTX 3080 Ti GPU보다 1.5배 빠른 AI 비디오와 1.7배 빠른 이미지를 생성한다.
에이서, 에이수스, 델 테크놀로지스, HP, 레노버, MSI, 레이저, 삼성 등 선도적인 제조업체들은 새로운 RTX AI 노트북을 출시해 바로 사용할 수 있는 생성AI 기능 풀세트를 사용자에게 제공한다. 신경망 처리 장치(NPU) 사용 대비 20배에서 60배까지 성능이 향상되는 새로운 시스템은 이번 달에 출하가 시작된다.
RTX GPU가 탑재된 모바일 워크스테이션은 간소화되고 안전한 생성AI와 데이터 사이언스 개발을 위해 텐서RT와 엔비디아 래피즈(RAPIDS)가 포함된 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어를 실행할 수 있다. 모든 엔비디아 A800 40GB 액티브 GPU에는 엔비디아 AI 엔터프라이즈 3년 라이선스가 포함된다.
AI 모델 구축을 위한 새로운 PC 개발자 도구
개발자가 PC급 성능과 메모리 공간을 사용해 사전 학습된 생성AI 모델과 LLM을 빠르게 생성, 테스트, 사용자 맞춤화할 수 있도록 지원하기 위해 엔비디아 AI 워크벤치를 발표했다.
AI 워크벤치는 이달 말 베타 버전으로 출시된다. 허깅 페이스(Hugging Face), 깃허브(GitHub), 엔비디아 NGC와 같은 인기 리포지토리에 대한 간소화된 액세스를 제공할 계획이다. 또한, 개발자가 프로젝트를 쉽게 재현, 협업, 마이그레이션할 수 있는 간소화된 사용자 인터페이스도 함께 제공한다.
프로젝트는 데이터센터, 퍼블릭 클라우드 또는 엔비디아 DGX 클라우드 등 거의 모든 곳으로 확장 가능하다. 추론과 가벼운 맞춤화를 위해 PC 또는 워크스테이션의 로컬 RTX 시스템으로 다시 가져올 수도 있다.
또한, 엔비디아는 HP와 협력을 통해 AI 모델 개발을 간소화하고 있다. 이는 데이터 사이언스를 위한 중앙 집중식 플랫폼인 HP AI 스튜디오에 RTX 가속 AI 모델과 소프트웨어 개발 키트를 포함하는 엔비디아 AI 파운데이션 모델과 엔드포인트를 통합해 이뤄지고 있다. 이를 통해 사용자는 PC와 클라우드에서 최적화된 모델을 쉽게 검색, 가져오기, 배포 등을 할 수 있다.
엔비디아는 최근 LLM 가속화를 위한 오픈소스 라이브러리인 윈도우용 텐서RT-LLM을 통해 텍스트 기반 애플리케이션으로 텐서RT를 확장했다. 현재 사용 가능한 텐서RT-LLM의 최신 업데이트를 통해 파이-2(Phi-2) 와 제퍼 7B(Zephyr 7B)가 PC용 사전 최적화 모델 목록에 추가됐다.
관련기사
- 21세기 산업혁명 ‘생성AI’ 파죽지세 성장
- 정부가 5조 8577억원 투자하는 '연구개발사업'
- 2024년의 경영 키워드는 ‘성장관리’
- [기고] 2024년 데이터 아키텍처 동향
- [기고] 대형 언어 모델의 역사
- 생성AI를 현명하게 쓰는 방법
- AI 편향성·환각 줄이는 'LLM 강화학습용 데이터 구축 플랫폼'
- [2024년 전망] '제로데이·모바일·생성AI 악용·핵티비즘·IoT/OT 공격' 주의보
- [2024년 전망] AI와 지속가능성, 기술 도입·인재 확보에 영향
- [기고] 데이터 관리가 비즈니스 성공의 열쇠
- 구세대 그래픽 카드 사용자를 위한 업그레이드 솔루션
- ‘크리티카: 제로’ 클라우드 서비스 제공
- 생성AI 기능으로 강화된 게이밍 GPU
- KT, 엔비디아 플랫폼 활용 기업 맞춤형 초거대 AI 모델 개발
- AI 기반 64비트 지원 비디오·이미지 SW ‘비디오 프록 컨버터 AI’ 속도·품질↑
- 엔비디아, 지포스 RTX 40 시리즈 노트북 신학기 기획전
- 엔비디아-시스코, 데이터센터 AI 인프라 개발 맞손
- 엔비디아, AI 디자인 지원 GPU 신제품 출시
- [MWC 2024] 레노버, 하이브리드 AI·AI 애플리케이션에 최적화된 'AI PC·에지 컴퓨팅' 선봬
- [GTC 2024] 엔비디아, 생성AI·가속 컴퓨팅·로보틱스 혁신 공개
- RT코어·텐서코어·NPU·에이다 쿠다 코어 탑재 모바일 워크스테이션...AI에 최적화
- 델, AI 기능 강화한 고성능 노트북 및 워크스테이션 제품 선공개
- 엔비디아, AI 인프라에 최적화된 네트워킹 스위치 X800 시리즈 발표
- 제조·물류 자동화하는 AI 기반 ‘아이작 로보틱스 플랫폼’
- 3D 그래픽 1초 만에 구현하는 '생성AI'
- 2개의 그래픽카드 지원하는 ‘에지 AI GPU 컴퓨터’
- 지속가능한 IT 환경 구매 돕는 AI 기반 ESG 엔진 'LISSA'
- 필요한 것만 골라서 만드는 보안 완전체 ‘AI 기반 CRaaS’
- 엔비디아-인트린직, 차세대 '로봇 파지 기술'로 AI 기반 산업 자동화 가속
- 레노버, 퀄컴 CPU 탑재 2종 'AI PC' 출시
- 세그마인드, 플랫폼에 이미지 생성AI '스테이블 디퓨전 3' 추가
- 고품질 센서 시뮬레이션 구현하는 엔비디아 ‘옴니버스 클라우드 센서 RTX’
