컨테이너 기반 운영 환경이 미션 크리티컬 시스템으로 확장되면서, 단일 사이트 정전이나 네트워크 단절로 발생하는 중단 위험을 최소화하기 위한 액티브-액티브 재해복구 구조가 필요해졌다. 멀티클러스터 운영 복잡성과 데이터 일관성 보장은 기업 인프라의 중요한 과제가 되고 있다.
클라우드 및 AI 인프라 기업 아크프라(Arcfra)가 자사 프로덕션급 컨테이너 관리 플랫폼의 주요 업데이트인 ‘아크프라 쿠버네티스 엔진(Arcfra Kubernetes Engine, AKE) 버전 1.5’를 공개했다고 18일 밝혔다.

AKE 1.5는 엔터프라이즈급 신뢰성과 정교한 거버넌스에 중점을 두며, 크로스사이트 액티브-액티브 재해복구(DR) 기능을 제공한다. 또한 멀티테넌시 관리와 플랫폼 관측성을 향상시켜 핵심 비즈니스 애플리케이션을 위한 최고 수준의 안정성을 보장한다.
기업들이 핵심 프로덕션 시스템을 쿠버네티스로 이전하면서, 정전이나 네트워크 장애와 같은 사이트 레벨 장애 위험이 증가하고 있으며, 기존 백업 및 복구 모델을 넘어서는 실질적 액티브-액티브 솔루션이 요구되고 있다. AKE 1.5는 아크프라의 액티브-액티브 스토리지 기술을 컨테이너 플랫폼과 통합해 이 요구 사항을 해결한다.
새로운 크로스사이트 액티브-액티브 배포 모델은 기본 및 보조 가용 영역 전반에 걸쳐 쿠버네티스 클러스터를 운영하며, 실시간 데이터 동기화, 동적 리소스 스케줄링, 자동•신속 장애 조치를 제공한다.
이 하이퍼컨버지드(hyper-converged) 이중 계층 고가용성(HA) 구조는 컨트롤 플레인과 데이터 플레인 모두에 대한 이중화를 보장하며, 네이티브 쿠버네티스 멀티클러스터 구성으로는 달성하기 어려운 데이터 일관성을 확보한다.
AKE 1.5는 VM 고가용성과 K8s 노드 자가 복구를 결합해 분 단위의 비즈니스 복구 시간(RTO)을 달성한다. 이는 클러스터 간 백업/복구 방식보다 빠르다. 또한 이 아키텍처는 두 가용 영역이 비즈니스 부하를 동시에 분담할 수 있도록 허용해 리소스 활용도를 최적화한다.
AKE 1.5는 포괄적인 프로젝트 및 네임스페이스 리소스 할당량(CPU, 메모리, 스토리지, GPU) 기능을 도입했다. 이 기능은 실시간 시각화된 리소스 제어 및 자동 경고 기능과 함께 제공돼 복잡한 멀티 팀 환경에서 정확한 리소스 할당을 보장하고 위험을 완화한다.
마지막으로 향상된 관측성(Enhanced Observability)과 컴플라이언스 기능을 통해 전면적인 운영 제어가 가능해졌다. 특히 새로운 감사 기능은 사용자, 애플리케이션, 쿠버네티스 API 및 컨트롤 플레인 활동에 대해 추적할 수 있다.
