기업 데이터의 대부분(80% 이상)은 비정형 데이터로 구성되어 있으며, 여기에 민감한 정보와 지식 자산이 포함되어 있어 보안 사고로 이어질 가능성이 크다. 그러나 기존 DSPM 솔루션들은 정확도 부족, 고비용, 낮은 확장성으로 인해 효과적인 대응이 어려웠다.

사이버 보안 서비스 기업 센트라(Sentra)가 비정형 데이터 문제를 해결하기 위해 새로운 AI 기반 비정형 데이터 분류 기능을 발표했다.

이번에 출시된 기능 센트라 고유의 AI 분류 엔진과 특화된 SLMs를 기반으로 하며, 기존 DSPM(Data Security Posture Management) 솔루션들이 해결하지 못한 정확도, 비용, 확장성 문제를 극복했다.

고정밀 컨텍스트 기반 분류와 지속 학습형 AI 엔진

센트라의 AI 엔진은 조직 고유의 민감 데이터·지식 자산의 문맥(Context)을 이해해 99% 이상 정확도로 고정밀 분류를 수행한다. 기존 정규식 기반 탐지처럼 단순 패턴 일치 여부를 확인하는 것이 아니라, 부서(재무·법무·인사·마케팅), 산업군(헬스케어·리테일·제조), 지리, 소유자 유형(고객·임직원·파트너), 민감도 등 다양한 속성을 함께 해석해 데이터 의미를 정교하게 파악한다.

또한 초기에 한 번 스캔한 이후에도 재스캔 없이 지속 학습을 수행하며 조직 고유의 데이터 카테고리를 자동 확장한다. 문서 의미 기반 클러스터링을 통해 재무 문서, 세금 양식, 연구 보고서, 제조 레시피, 알고리즘 설계 등 세부 유형까지 자동으로 그룹화하여 수작업 검증 없이 정책을 자동 집행할 수 있는 데이터 거버넌스 체계를 완성한다.

SLM 기반 대규모 데이터 처리 효율과 비용 최적화

센트라는 SLM(Small Language Model) 기반 구조를 적용해 기존 LLM 대비 10배 이상의 처리 효율을 제공한다. 펫타바이트급 데이터에서도 성능 저하 없이 대량 문서를 분류하며, 재스캔 비용이 발생하지 않는 자동 최적화 구조로 수백만~수억 건 규모의 데이터도 비용 효율적으로 처리할 수 있다.

또한 70개 이상의 언어를 기본 지원하며, 고객 환경에 따라 신규 언어 학습이 가능해 글로벌·멀티언어 환경에서도 정확한 데이터 분류와 정책 일관성을 유지할 수 있다.

고객 사례로 글로벌 금융 서비스 기업 소파이(SoFi)의 애플리케이션 보안 엔지니어 재커리 슐츠(Zachary Schulze)는 “센트라의 AI 분류 엔진은 우리 조직 환경에 맞춰 지속 학습하며 민감 데이터를 정확히 식별한다. 이를 통해 조직 전반에 생성AI 통합을 더 자신 있게 진행할 수 있다.”라고 전했다.

야르 코헨(Yair Cohen) 센트라 공동창업자 겸 제품 VP는 “생성AI는 혁신을 가속하지만, 민감 정보가 유출될 경우 심각한 리스크를 초래할 수 있다.”라며 “센트라의 AI 분류 엔진은 정확도, 문맥 이해, 확장성, 비용 효율성 측면에서 독보적이며, 기업이 생성AI를 안전하고 책임감 있게 활용하도록 돕는다.”라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지