AI 기술의 확산과 하이브리드 클라우드 환경이 복잡해지면서, 기업은 보다 지능적이고 안전한 IT 인프라 운영 체계를 필요로 하고 있다. 특히 운영체제 수준에서 AI와 보안 기능을 통합하고, 다양한 환경에서 생성AI 모델을 효과적으로 배포할 수 있는 추론 솔루션에 대한 수요가 높아지고 있다.

레드햇(Red Hat)이 5월 20일(현지시각) 개최된 ‘레드햇 서밋 2025’에서 엔터프라이즈 리눅스 플랫폼 ‘레드햇 엔터프라이즈 리눅스 10(RHEL 10)’과 ‘레드햇 AI 인퍼런스 서버(Red Hat AI Inference Server)’를 출시했다고 21일 밝혔다. 

‘레드햇 서밋 2025’에서 키노트 발표하는 레드헷 크리스 라이트 CTO
‘레드햇 서밋 2025’에서 키노트 발표하는 레드헷 크리스 라이트 CTO

AI 기반 운영체제 혁신과 보안 강화

하이브리드 환경 전반에서의 복잡성과 보안 요구에 대응하는 RHEL 10은 생성AI 기반의 ‘레드햇 라이트스피드(Lightspeed)’ 기능을 통해 명령줄에서 자연어 인터페이스로 운영체제를 제어할 수 있으며, 상황에 맞는 가이드를 제공한다. 

보안 측면에서도 RHEL 10은 양자 내성 암호(PQC)를 지원하며, 연방정보처리표준(FIPS) 기반 컴플라이언스를 만족한다. PQC 알고리듬과 서명 체계를 통해 현재 수집된 데이터를 향후 해독 공격으로부터 보호할 수 있으며, 하이브리드 인프라 통합을 위한 ‘이미지 모드(image mode)’ 기능도 제공한다. 이 기능은 운영체제 및 애플리케이션 배포를 통합된 워크플로로 단순화하며, 구성 드리프트 방지와 정확한 패키지 선택을 지원하는 레드햇 인사이트 기능도 함께 제공한다.

RHEL 10은 AWS, 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure) 환경에 사전 튜닝되고 완전 지원되는 이미지로 제공되며, 포드맨 데스크탑(Podman Desktop) 등 커뮤니티 지원 툴도 레드햇 익스텐션 저장소를 통해 보다 안전하게 활용할 수 있다.

또한 사이파이브(SiFive)와 협력해 RISC-V 기반 하이파이브(HiFive) P550 플랫폼용 개발자 프리뷰도 제공하며, 향후 출시 예정인 ‘레드햇 시큐리티 셀렉트 애드온(Security Select Add-On)’을 통해 연간 최대 10개의 CVE 취약점에 대한 보안 패치를 요청할 수 있는 기능도 포함된다.

AI 추론 표준화를 위한 인퍼런스 플랫폼

레드햇 AI 인퍼런스 서버는 UC 버클리의 오픈소스 프로젝트인 vLLM을 기반으로 하며, 뉴럴매직 기술을 통해 모델 압축과 최적화된 추론을 지원한다. 이 제품은 RHEL AI 및 오픈시프트 AI의 통합 구성 요소 또는 독립형으로 제공되며, 다양한 클라우드 환경에서 고성능·고효율 AI 추론을 가능케 한다.

특히, 허깅페이스(Hugging Face)를 통해 최적화된 선도적 모델들을 바로 사용할 수 있으며, 딥시크(DeepSeek), 젬마(Gemma), 라마(Llama), 미스트랄(Mistral) 등 주요 모델에 대한 제로데이 통합도 제공된다.

레드햇은 AI 추론 표준화를 목표로 vLLM 및 llm-d 중심의 생태계를 구축 중이며, 고객이 인프라 환경이나 AI 모델 종류에 구애받지 않고 AI를 배포할 수 있도록 지원하고 있다. AI의 대중화와 함께 운영체제 수준의 통합 및 AI 인퍼런스 성능 향상은 기업의 디지털 혁신과 비용 효율성 확보에 중요한 역할을 하게 될 전망이다.

현재 RHEL 10은 레드햇 고객 포털을 통해 제공되며, 개발자는 무료 레드햇 개발자 프로그램을 통해 소프트웨어, 설명서, 데모 등 다양한 리소스에 접근할 수 있다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지