최근 인식 기술을 넘어 문서 내 의미와 맥락까지 파악할 수 있는 AI 기술에 대한 관심이 높아지고 있다.
한국딥러닝이 광학문자인식(OCR) 기술을 넘어 문서의 의미와 구조를 자동으로 분석해 핵심 정보를 추출하는 VLM(Vision-Language Model) 기반의 OCR 솔루션 '딥(DEEP) OCR+'를 출시했다고 밝혔다.
이 솔루션은 한국딥러닝의 지난 5년간 4억 장 이상의 텍스트 및 이미지 문서를 학습한 VLM 모델을 기반으로, 별도의 데이터 수집이나 라벨링 없이 다양한 문서 유형을 즉시 처리할 수 있다.
딥 OCR+는 문서의 전체 구조와 의미를 이해하여 비정형화된 문서도 즉시 처리 가능하다. 이미지와 텍스트를 동시에 처리할 수 있는 VLM 기술 덕분에, 사용자는 문서를 업로드하면 별도의 학습 없이도 주요 정보를 구조화된 형태로 얻을 수 있다.
예를 들어, 계약서를 입력하면 날짜, 금액, 주요 조항 등을 자동으로 추출하고 리스크 항목을 요약해주는 기능을 제공한다. 이를 통해 문서 검토 및 입력에 소요되는 시간을 80% 이상 단축시킬 수 있으며, 다양한 양식의 문서를 별도 커스터마이징 없이 처리할 수 있어 업무 자동화에 기여할 수 있다.
구축형 외에도 SaaS 및 API 형태로 제공되어 고객사가 자사 환경에 맞게 유연하게 도입할 수 있다. 평균 도입 기간은 2주 내외로, 기존 OCR 솔루션의 수억 원 규모 프로젝트와 수개월의 개발 기간에 비해 비용과 시간 측면에서 진입 장벽을 획기적으로 낮췄다.
또한, 다국어 혼합 문서나 정형화되지 않은 양식에도 대응할 수 있어 한국어, 영어, 숫자, 특수문자가 혼합된 문서나 복잡한 표와 문단 구조를 포함한 문서도 문제없이 처리할 수 있다.
김지현 한국딥러닝 대표는 "딥 OCR+는 금융, 법률, 공공 등 다양한 분야에서 도입 가능성이 높으며, 일부 대형 프로젝트에서는 이미 시범 적용이 진행 중"이라며 "이번 신제품은 문서 처리 기술의 진화를 보여주는 사례가 될 것"이라고 밝혔다.

관련기사
- 바이오테크 개발 지원 P2P 솔루션...‘CRO 검색·실시간 분석·AI 자동화’ 구현
- 산업 특화 ‘AI 문서처리 솔루션’...수동 프로세스 제거·성분 안전·규정 준수 개선
- 무료 ‘AI PDF 요약 및 질의응답 솔루션’...PDF 요약·추론·OCR 기능 통합
- 멀티모달 AI 평가 도구 'MLLM 심판'... 환각 감지·객체 검증·유효성 테스트 지원
- AI 기반 ‘침해 사고 대응 플랫폼’...빠르고 경제적 침해 대응·규정준수 보장
- 카스퍼스키, 구글 플레이·앱스토어서 OCR 악용 ‘스파크캣’ 트로이 목마 발견
- AI 에이전트 개발을 쉽고 편하게 ‘그래프릿 에이전트 툴 라이브러리’
- 이미지 내 텍스트, 100개 이상 언어로 번역 척척!
- 블록체인 기반 ‘모바일 신분증 검증 및 사본 생성 솔루션’, 안전한 금융 서비스 지원
- 한국딥러닝, AI '인체 3D 데이터 구축' 사업 수주
- 로민, ‘우체국 창구 업무 자동화 AI 문서인식 연구 용역 사업’ 수주
- 한국딥러닝, VLM OCR 솔루션 ‘딥 OCR+’ 공개
- 한국딥러닝, AI 개발자 13개 포지션 채용...VLM 기반 AI 기술 강화
- 한국딥러닝 ‘딥 에이전트’ 수주액 397% 성장
- 경기도청, 생성AI로 행정문서 90% 디지털 전환 본격화
- 한국딥러닝, 제조업 특화 문서 자동화 솔루션 '딥 에이전트 포 제조' 출시
