현재 많은 기업은 신용카드 번호나 주민등록번호와 같은 정형 식별자 기반 민감 정보에만 의존하여 DLP 정책을 운용하고 있다. 그러나 실제 보안 위협은 소스코드, 연구자료, 전략 문서, 특허 문서, 재무 로드맵 등 정형화되지 않은 문서들에 존재하며, 이들은 기존의 정규식(regex) 기반 패턴 매칭 탐지로는 식별이 불가능하다.
글로벌 보안 서비스 기업 나이트폴(Nightfall, CEO 로한 사세)이 기존 데이터 유출 방지(DLP, Data Loss Prevention) 솔루션이 놓치기 쉬운 지적 재산(IP) 정보의 유출 방지에 특화된 LLM 기반 탐지 시스템 ‘생성AI 파일 분류기(File Classifier Detector)’를 발표했다.
AI 분류기로 문서 의미·구조·업무 맥락까지 분석
이 솔루션은 LLM 기반 탐지기를 통해 문서의 구조적 의미와 비즈니스 맥락을 이해하여, 인간이 문서를 구분하는 방식과 유사하게 M&A 계획서, 사내 전략 문서, 원천 소스코드 등을 식별한다.

해당 시스템은 총 22종의 비즈니스 핵심 문서 유형을 즉시 탐지할 수 있으며, 사용자는 별도의 학습 데이터 없이 예시 파일 업로드 또는 자연어 설명 프롬프트 입력만으로 신규 탐지기를 생성할 수 있다. 예컨대, 한 금융기관 사용자가 “차주 정보가 포함된 주택담보대출 신청서”라고 설명하거나 샘플 파일을 업로드하면, 나이트폴은 이를 학습해 맞춤형 탐지기를 자동 생성한다.
나이트폴은 해당 탐지기를 기존 SaaS 앱, 엔드포인트, 이메일, 생성AI 툴 등 모든 주요 채널에 적용 가능하도록 설계했으며, 각 탐지 결과에 대해 신뢰도 점수 및 정황 설명 메타데이터를 제공해 정책 조정 및 오탐 방지도 가능하다.
주요 기술 특징 및 지원 기능으로 ▲계약서, 재무제표, 로드맵, 인사 문서, 소스코드, M&A 문서 등 22종의 사전 학습 문서 유형 지원 ▲프롬프트 또는 예시 문서만으로 신규 문서 유형 탐지기 생성 가능 ▲문서 구조 및 의미 이해 기반한 탐지 ▲브라우저 기반 개인 클라우드 업로드 및 생성AI 앱, Git/CLI 명령어, USB, 클립보드, 스크린샷, 클라우드 동기화 등 전방위 데이터 유출 경로 대응 ▲이메일 통한 외부 유출 관리 등을 지원한다.
특히 LLM 기반 분석 기술은 인간이 문서 내용을 직관적으로 이해하는 방식과 유사한 원리로 작동해, 단순한 키워드 일치나 메타데이터만을 기반으로 하는 기존 DLP의 한계를 극복한다.
로한 사세(Rohan Sathe) 나이트폴 CEO는 “가장 파괴적인 보안 침해는 카드번호나 주민번호 유출이 아니라 수년간 축적된 연구개발(R&D) 결과, 고객 전략, 핵심 소스코드의 탈취”라며, “기존 DLP는 정형 데이터에만 집중하기 때문에 이러한 자산 보호에는 사실상 무력하다. 나이트폴의 생성AI 분류기는 진정으로 기업 가치를 지키는 정보 보호에 초점을 맞췄다.”라고 설명했다.
관련기사
- 내부자 위협 선제 대응하는 AI 기반 자율 데이터 유출 방지 플랫폼
- 전사 데이터 최적화 핵심, 고객데이터플랫폼 CDP…기업 수요 확대 속 30%대 폭발적 성장
- 섀도 AI, 조직 내 ‘보안 사각지대’로 확산...통제 불능 리스크 확대
- 데이터 위험 ‘감지·분석·조치’ 원스톱 해결하는 AI DSPM...클라우드에서 에지까지 전방위 보호
- 항상 검증하는 ‘제로 트러스트 보안’, 조직의 새 표준으로 확산
- 2026년 3대 사이버 위협, ‘AI·가상화·섀도우 에이전트’
- 개인정보 보호 중심 AI...‘대화형 지능’으로 기업 데이터 복잡성 해결
- 민감 데이터 안전하게 활용하는 ‘기밀 AI 인프라’...정확도와 신뢰 동시 확보
- 모바일 앱 데이터 유출 사전 차단...AI가 SDK 위험 실시간 감시
