글로벌 시장조사기관 마켓앤마켓(MarketsandMarkets)에 따르면, AI 학습 데이터 세트 시장은 연평균 27.7%의 성장률을 기록하며 2029년 95억 8천만 달러 규모에 이를 전망이다. 이러한 시장 성장의 중심에는 생성AI의 신뢰성을 좌우하는 ‘데이터 품질’이 있다. AI가 저품질 데이터를 학습하면 ‘환각 현상(Hallucination)’을 피하기 어려워, 고품질 데이터 전처리 기술의 필요성이 부각되고 있다.

AI 전문 기업 사이냅소프트(Synapsoft, 대표 전경헌)가 최근 한국주택금융공사에 도큐애널라이저를 공급했다고 밝혔다.

한국주택금융공사에 도입된 사이냅소프트 도큐애널라이저
한국주택금융공사에 도입된 사이냅소프트 도큐애널라이저

공사는 보금자리론, 주택보증 등 다양한 서민 금융 지원 업무를 수행하며 HWP, PDF, 이미지 등 다양한 비정형 문서를 다룬다. 공사는 RAG(검색 증강 생성) 시스템 구축 시 데이터의 정확한 분석과 해석을 최우선 과제로 설정했고, 이를 위해 도큐애널라이저를 도입했다. 이로써 LLM이 문서 내용을 왜곡 없이 이해하고 정확한 답변을 생성할 수 있는 기반이 마련됐다.

‘사이냅 도큐애널라이저’는 문서 제목, 표, 이미지, 단락 등 시각적 구성과 논리적 순서를 정교하게 분석하는 시각적 구조 분석(VSA) 기술을 탑재했다. 이를 통해 원본 문서의 맥락을 보존하면서 AI가 학습하기 적합한 마크다운(MD), JSON 등 정형 데이터로 변환하는 것이 특징이다.

도큐애널라이저는 삼성디스플레이, 한화시스템, 한국남부발전 등 국내 주요 기업과 기관에도 도입되며 기술력을 입증하고 있다. 이를 통해 금융, 제조, 공공기관 등 다양한 산업 현장에서 데이터 품질 개선과 AI 성능 강화를 동시에 실현하는 역할을 하고 있다.

사이냅소프트는 지난해 2월 코난테크놀로지와 LLM 사업 협력을 위한 업무협약(MOU)을 체결했다. 이 협력에서 사이냅소프트는 코난테크놀로지의 자체 모델 ‘코난 LLM’ 학습에 필요한 디지털 문서 데이터의 정제와 가공을 직접 담당하며 솔루션의 경쟁력을 강화했다.

전경헌 사이냅소프트 대표는 “성공적인 LLM 프로젝트는 결국 얼마나 고품질의 학습 데이터를 확보하느냐에 달려있다”며, “한국주택금융공사 공급과 코난테크놀로지와의 협력은 도큐애널라이저가 생성AI 신뢰도를 높이는 필수 솔루션임을 보여주는 중요한 이정표”라고 밝혔다. 이어 “앞으로도 기업과 기관의 성공적인 AI 전환(AX)을 이끄는 핵심 기술 파트너가 되겠다”고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지