AI 애플리케이션에 필요한 벡터 데이터가 폭증하면서, 이를 효율적으로 저장·검색할 수 있는 고성능 데이터베이스 기술이 중요해지고 있다. 기업들은 대규모 AI 시스템을 운영하면서도 비용을 제어할 수 있는 기술을 요구하고 있으며, 특히 검색 정확도와 시스템 성능을 유지하면서도 스토리지와 운영 부담을 줄이는 솔루션이 절실한 상황이다. 이에 따라 오픈소스 벡터 데이터베이스 솔루션은 유연성과 확장성을 갖춘 핵심 인프라로 주목받고 있다.
오픈소스 벡터 데이터베이스 개발 기업 질리즈(Zilliz)가 대규모 AI 워크로드를 위한 비용 최적화 기능을 강화한 오픈소스 벡터 데이터베이스(DB) ‘밀버스(Milvus)’의 최신 버전인 ‘밀버스 2.6’을 공식 출시했다고 밝혔다.
이번 버전은 AI 대중화를 위한 접근성과 경제성을 목표로 설계되었으며, 스토리지, 컴퓨팅, 운영, 개발자 생산성 측면에서 전방위적인 비용 절감을 지원한다. 질리즈는 벡터 검색의 효율성을 극대화하면서도 인프라 운영 복잡성을 줄이는 기능들을 대폭 강화했다.
저장·연산 비용 절감 핵심 기술 도입
밀버스 2.6은 스토리와 메모리 사용량을 줄이는 기술을 다수 도입했다.
우선 ‘핫/콜드 계층형 저장소(Tiered Storage)’ 기능은 자주 사용되는 벡터 데이터를 고성능 저장소에, 덜 사용되는 데이터는 저비용 저장소에 자동 분리 저장해 스토리지 비용을 줄이면서도 검색 성능은 유지한다. 이 기능은 미니오(MinIO), 코히시티(Cohesity), 퓨어스토리지(Pure Storage), 넷앱(NetApp) 등 주요 스토리지 솔루션과 통합돼 작동한다.

‘Int8 벡터 압축(Int8 Vector Compression)’은 고밀도 벡터를 8비트 정수로 저장해 메모리 요구량을 줄이면서도 정확도를 유지하며, ‘RabitQ 1비트 양자화(Quantization)’는 더 극단적인 압축을 통해 검색 품질을 유지하면서 메모리 사용량을 절반으로 줄일 수 있다.
또한 디스크 기반 외부 메시지 큐(Kafka, Pulsar 등) 없이 자체 로그 기록 기능을 제공하는 새로운 WAL(Write-Ahead Log) ‘우드페커(Woodpecker)’가 적용돼, 인프라를 간소화하고 쓰기 성능도 향상한다.
운영 효율 향상 및 설치 간소화
밀버스 2.6은 운영 복잡성을 줄이기 위한 아키텍처 혁신도 포함하고 있다.
‘스트리밍 노드(Streaming Node)’는 실시간 데이터 수집 기능을 플랫폼 내에 기본 내장해 외부 메시지 큐 없이도 데이터 수집이 가능하며, 비용을 절감한다. ‘CDC + 벌크인서트(BulkInsert)’ 기능은 지리적으로 떨어진 인스턴스 간 데이터를 손쉽게 복제할 수 있도록 해 글로벌 AI 애플리케이션에 적합한 환경을 제공한다.
‘스토리지 v2 포맷(Storage v2 Format)’은 아파치 스파크(Apache Spark) 등 외부 데이터 처리 프레임워크와의 호환성을 고려한 설계로, 향후 확장성도 강화했다. 또한 APT와 YUM 기반 패키지 배포를 지원해 설치 및 업그레이드가 쉬워졌다.
개발 생산성 향상...AI 개발자 위한 기능 내장
밀버스 2.6은 개발자 생산성 측면에서도 다양한 기능을 제공한다.
‘데이터 인/아웃(Data-In, Data-Out)’ 기능은 텍스트, 이미지, 오디오 등의 원시 콘텐츠를 직접 수집하고 내장된 추론 기능으로 벡터화해 사전 전처리 파이프라인 없이도 처리 가능하다.
또한 ‘커스텀 리랭커(Custom Reranker)’를 통해 사용자 정의 함수와 필드를 활용한 재정렬 논리를 직접 구현할 수 있으며, 텍스트 및 JSON 검색 기능도 강화돼, 한국어·일본어 등 아시아어 토크나이징, JSON 키 경로 기반 질의 등을 지원한다.
‘샘플링 및 집계 질의(Sampling + Aggregation Queries)’는 개발 중 빠른 반복 테스트를 가능하게 해 AI 모델 개발의 생산성을 높인다.
밀버스는 현재 전 세계 1만여 개 이상의 조직에서 벡터 검색을 위해 활용되고 있으며, 오픈소스 아파치 2.0 라이선스를 기반으로 누구나 감사, 수정, 기여가 가능하다.
질리즈 찰스 시에(Charles Xie) CEO는 “AI 기술을 모두가 사용할 수 있도록 만드는 것이 우리의 사명이며, 밀버스 2.6은 이를 실현하기 위한 중요한 진전”이라며 “앞으로도 고성능과 비용 효율성을 동시에 제공하는 기술 개발을 지속할 것”이라고 말했다.
관련기사
- 10ms 이하 응답 속도 ‘완전 관리형 벡터 DB 서비스’...AI 성능·서비스 개선, 비용 절감
- ‘AI 개인 정보 위험 태세 관리 솔루션’...규정 준수·개인정보 보호 지원
- AI 거버넌스 강화·LLM 환각 감소·개발 효율 높이는 ‘AI 게이트웨이’...안전한 ‘생성AI·에이전트형 AI’ 운영
- 효율적인 RAG 시스템 구축법...벡터 이미지 검색·데이터베이스 통합
- 키옥시아, AI 애플리케이션용 고용량 122.88TB SSD 출시
- 페블러스, MWC 2025서 인터랙티브 데이터 시각화·분석 도구 ‘페블로스코프’ 공개
- 생성AI 시스템 DRAM 요구사항 줄이는 SSD 최적화된 오픈 소스 SW
- 4비트 양자화로 LLM 추론 속도 56%↑
- AI 모바일 자산 관리 솔루션...유지보수 자동화로 생산성·의사결정 향상
- 장기 보관 데이터의 보안성·검색 속도·비용 효율 높이는 ‘콜드 스토리지 솔루션’
- AI 주도권 경쟁 본격화...핵심 경쟁력은 '지능형 데이터 인프라'
- AI 검색 성능 높이는 ‘벡터 인덱싱’...응답 속도·전환율 향상
- 넷앱, SE 랩스 어워드 '엔터프라이즈 데이터 보호' 부문 수상
- AI 기반 인지 검색, 기업 정보 활용과 생산성↑비용↓
- VMware 클라우드 마이그레이션 효율 높이는 외부 스토리지 통합 기술
- 보안·규정 준수 없는 AI 확장, 기업에 치명적 리스크
- 클라우드로 가는 VM웨어, 넷앱·아마존 EVS가 속도 올린다
- 퓨어스토리지, 12년 연속 가트너 매직 쿼드런트 리더 선정
- 넷앱 스토리지그리드 12.0, 20배 빨라진 성능으로 AI 프로젝트 가속
- [Success Story] 람다256, 퓨어스토리지 ‘에버그린//원’으로 블록체인 데이터 안정성·확장성 강화
- 퓨어스토리지, 엔터프라이즈 데이터 클라우드 기반 스토리지 전략 공개...“데이터 주권·사이버 복원력 대응 강화”
- AI로 데이터베이스 관리 자동화...멀티클라우드 시대의 쿼리 최적화와 보안 혁신
- 퓨어스토리지, 단일 플래시블레이드 어레이로 3조 개 객체 저장 성공
- 쿠버네티스 기반 VM 현대화 가속화 ‘쿠베 데이터스토어’...가상화 복잡성↓
