최근 공격자들이 생성AI와 챗GPT 등을 악용한 지능화된 공격이 지속되고 있어 AI가 생성할 수 있는 가짜 내용, 조작된 정보 및 미묘하게 왜곡된 데이터 등을 빠르게 식별하고 대응할 수 있는 침해대응 체계의 중요성이 대두되고 있다.

이러한 배경에서 AI 데이터셋을 기존에 구축된 데이터셋과의 정합성, 호환성을 유지하면서 탐지은닉, 생성AI를 악용한 최신 위협 트렌드를 반영한 형태로 최신화 및 고도화해 구축하고 실제 침해 사고 대응이 가능한 AI 모델 개발이 시급해졌다.

AI 기반 사이버 위협 인텔리전스(CTI) 전문 기업 샌즈랩(대표 김기홍)이 한국인터넷진흥원(KISA)에서 발주한 ‘사이버보안 AI 데이터셋 구축 및 활용 강화 사업’을 수주했다고 28일 밝혔다.

공격그룹 별로 생성되는 위협 프로파일링 데이터셋의 정의 및 구성도
공격그룹 별로 생성되는 위협 프로파일링 데이터셋의 정의 및 구성도

이번 사업은 데이터셋 및 AI 모델을 활용한 사이버 보안 분야 내 선제적 도입 및 사용 활성화, 지속적인발전을 목적에 두고 있다. 이번 사업에서 샌즈랩은 보안운영(SecOps) 플랫폼 전문 기업 로그프레소(대표이사 양봉열)와 함께 AI 기반의 능동형 대응 체계 구축에 특화된 컨소시엄을 구성했다.

이번 사업의 예산은 총 45억원 규모로 수행 기간은 6개월이다. 이 사업의 컨소시엄은  AI 데이터셋 2종(최신 악성코드, 위협 프로파일링) 구축 및 최신화를 핵심으로 ▲ AI 데이터셋의 수집(rawdata) 및 가공구축 환경 마련 ▲품질검증 및 수요처 실증 강화 ▲공유 및 활용 지원 ▲활용 확대 방안 발굴 및 성과 확산 지원 등을 함께 수행할 예정이다.

최신 위협 프로파일링 데이터셋의 연관관계 추적
최신 위협 프로파일링 데이터셋의 연관관계 추적

이와 함께 사이버보안 분야 데이터셋 구축 및 AI 모델 생성에 최적화된 프로세스뿐 아니라 생성AI 로 공격 그룹 정보 및 최신 동향 정보 자동화를 실현할 계획이다. 또한 사이버 보안에 특화된 온프레미스(On-Premise) sLLM을 개발해 실제 보안 환경에서의 직접 적용을 통해 실제 침해 사고 대응 입장에서 유의미한 결과와 가능성을 확인할 방침이다.

사업이 완료되면 생성AI, APT 공격 도구, 랜섬웨어 등 국민 디지털 안전에 파급도 높은 위협 데이터를 민간에 제공, 최신 위협에 선제적 대응이 가능해진다. 또한 AI 데이터셋 획득에 어려움을 겪거나 AI를 활용한 지능형 침해대응 기술 도입이 필요한 수요처를 대상으로 실효성을 검증해 사이버 위협대응 역량도 강화한다.

이를 통해 샌즈랩은 국가 차원의 대규모 사이버보안 분야에 특화된 AI 데이터셋을 구축해 사이버 보안 분야 AI를 활용한 침해대응 적용 방법론 및 우수사례를 발굴할 계획이다.

위협 프로파일링 데이터셋의 AI 연동과 활용 방안
위협 프로파일링 데이터셋의 AI 연동과 활용 방안

김기홍 샌즈랩 대표는 “이번 사업은 단순 위협 정보를 수집, 분석해 대응하는 기존 방식을 벗어나 공격 상황에 대한 설명력과 대응 우선순위를 파악할 수 있는 정보 생성 자동화 체계를 구축하고 활용하는 것이 필요하다.”라며, “LLM을 비롯한 생성AI 기술을 사이버 보안 기술과 융합해 AI 데이터셋의 활용을 촉진시키고 실효성 및 품질 검증을 거쳐 구축한 데이터셋의 활용 가치를 더욱 극대화 할 것”이라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지