산재된 구조화되지 않은 데이터는 생성AI를 비롯한 지능형 솔루션 도입에 제약 요인으로 작용한다. 특히 금융, 보험, 의료, 법률 등 규제가 엄격하고 문서 의존도가 높은 산업일수록 다양한 형식의 비정형 데이터가 방대한데, 이들 데이터를 AI가 이해하고 처리할 수 있는 형태로 정제·구조화하기가 쉽지 않다.
기업들은 생성AI와 에이전틱 AI 기반 자동화로 비즈니스 혁신을 도모하고 있으나, 여전히 데이터 품질과 일관성 확보가 난제로 지적되고 있으며, 잘못 구조화된 데이터로 인해 AI 모델의 오작동이나 잘못된 추론 가능성까지 우려되고 있다. 이러한 배경에서 비정형 데이터를 AI가 학습 가능한 정보로 바꿔 주는 기술 수요가 급증하고 있다.
글로벌 콘텐츠 서비스 기업 하이랜드(Hyland)가 기업의 비정형 데이터를 관리하는 클라우드 플랫폼 ‘콘텐츠 혁신 클라우드(Content Innovation Cloud)’에 비정형 데이터를 AI가 이해할 수 있는 형태로 전환해 에이전틱 AI의 인식과 추론, 자동화 정확도를 높이는 ‘지식 강화(Knowledge Enrichment)’ 기능을 공식 출시했다고 밝혔다.
비정형 데이터, AI 이해 가능한 구조로 변환
하이랜드 지식 강화의 가장 큰 차별점은 비정형 원천 데이터를 AI가 해석할 수 있는 지능형 구조화 데이터로 전환한다는 점이다. 600여 개 파일 형식을 지원해 텍스트, 이미지, 오디오, 비디오를 아우르는 멀티모달 처리 방식으로 파일 내 구조, 의미, 콘텐츠를 추출하며, 결정적 추출(deterministic extraction) 기법을 사용해 정확도를 높인다. 이 과정에서 레이아웃, 의미적 관계, 문서 간 연관성을 유지해 AI 시스템이 정보의 문맥을 이해할 수 있도록 지원한다.

또한 데이터 카탈로그와 연동돼 비정형 데이터뿐 아니라 기존 구조화 데이터의 메타데이터도 일관되게 관리할 수 있다. 이로써 데이터 레이크, ECM(Enterprise Content Management) 플랫폼, 분산 저장소 등 어느 환경에서나 데이터 정합성을 유지할 수 있다.
AI 정확도 향상·데이터 파이프라인 통합
하이랜드 지식 강화는 엔터프라이즈 데이터 레이크, 데이터 카탈로그, 분석 파이프라인과 손쉽게 통합될 수 있도록 API 우선(API-first) 아키텍처로 설계됐다. 데이터 과학자와 엔지니어가 신뢰도 높은 정제 데이터를 활용해 AI 모델을 빠르게 구축·배포할 수 있으며, 로우코드(low-code) 툴과 워크플로 플랫폼과도 연계돼 비즈니스 사용자도 손쉽게 활용할 수 있다.
하이랜드 지식 강화는 AI 프로젝트의 데이터 준비 과정을 단축해 AI 구축을 가속화할 수 있다. 구조화된 데이터는 AI 시스템이 높은 정확도로 문맥을 해석하고 추론하게 하며, AI 모델 학습과 배포 과정에서 수작업 데이터 준비를 줄여 효율성을 높인다. 또한 지식 강화가 금융, 보험, 의료, 정부, 법률, 컴플라이언스 등 콘텐츠 집약적 산업에서 산업별 요구사항을 반영한 데이터 변환을 지원한다.
ECM 전문 기업 ECM360 로이 갓윈(Roy Godwin) 매니징 디렉터는 “보험 업계에서 사진과 손해 사정 데이터를 수집할 때, 지식 강화가 전체 접수 프로세스를 간소화하고 더 스마트한 클레임 자동화를 위한 기반을 마련해 준다.”라고 말했다.
관련기사
- 페블러스, 비정형 데이터 진단·개선 솔루션 ‘데이터 클리닉’ 조달청 혁신제품 지정
- ‘에이전틱 문서처리 솔루션’...생성AI 기반 의미 이해·추론·실행 ‘지능형 전사 문서처리’
- 비정형 데이터 실시간 통제 ‘파일 활동 모니터링 기술’...위협 대응·규정 준수 자동화
- 제로 트러스트 기반 비정형 데이터 보호 솔루션...온프레미스·클라우드 데이터 보안↑
- AI 기반 실시간 데이터 품질 관리 플랫폼...기업 경쟁력·데이터 거버넌스 강화
- 기업 맞춤형 AI 합성 데이터 플랫폼...속도·보안·정확성 향상
- AI 잠재력 활용 극대화 전략 "가시성· 행동·실제 지표"
- 기업 AI 도입 79%·AI 보안 전략 6%로 격차 심화...보안 현대화 시급
- 생성AI 시대, IT 관리 효율화 위해 전략적 도입과 교육 필수
- 링크브릭스 호라이즌AI, 설립 4개월 만에 20억원 투자 유치 및 특허 취득
- 멀티환경 지원 AI 에이전트로 데이터 활용과 수익 창출 강화
- 아웃시스템즈, 안세준 신임 한국 지사장 선임
- AI 에이전트 메시와 컨텍스트 엔진...기업 자동화와 의사결정 혁신
- AI 데이터 엔지니어, 자동 코드 생성으로 기업 데이터 파이프라인 혁신
