공공 부문에서 인공지능(AI)을 활용한 데이터 기반 행정의 수요가 증가하면서, AI 학습에 필요한 고품질 데이터 확보가 핵심 과제로 부상하고 있다. 특히 텍스트, 이미지, 음성 등 비정형 데이터는 오류, 편향, 왜곡 등의 문제가 데이터 신뢰성과 모델 성능에 직접적인 영향을 미치고 있다. 이에 따라 AI 학습 전에 데이터 품질을 정량적으로 진단하고 개선할 수 있는 자동화된 솔루션에 대한 수요가 빠르게 늘어나고 있으며, 정부 역시 AI 친화적인 공공데이터 평가 지표를 도입해 대응에 나서고 있다.

AI 데이터 솔루션 전문기업 페블러스(Pebblous)는 데이터 품질 진단 및 개선 솔루션인 ‘데이터 클리닉(Data Clinic)’이 조달청 혁신제품으로 지정됐다고 발표했다. 데이터 클리닉은 텍스트, 이미지, 음성 등 다양한 비정형 데이터의 품질을 AI 기반 전수조사 방식으로 자동 진단하고, 합성 데이터 추가, 경량화 등을 통해 품질을 개선한 후, 결과를 시각화하는 올인원 품질 관리 솔루션이다. 이 제품은 특히 공공 AI 학습용 데이터의 신뢰성 확보를 위한 핵심 도구로 주목받고 있다.

페블러스 데이터 클리닉 서비스
페블러스 데이터 클리닉 서비스

AI 기반 자동 진단과 정량적 평가 기술 확보

데이터 클리닉은 비정형 데이터에 포함된 노이즈, 오류, 중복, 편향, 왜곡 등의 문제를 AI가 자동으로 탐지하고, 이에 기반해 데이터의 구조를 분석한 후 적절한 품질 개선 작업을 수행한다. 특히 데이터에 따라 합성 데이터를 추가하거나 불필요한 데이터를 제거해 경량화를 진행하며, 데이터 품질을 시각적으로 표현할 수 있는 페블로스코프(Pebbloscope) 기능을 제공해 데이터 품질 진단과 개선 결과를 직관적으로 파악할 수 있도록 한다. 사용자는 데이터의 흐름과 품질 상태를 인터랙티브하게 확인할 수 있어, AI 학습 전 단계에서 품질 통제 및 커뮤니케이션이 용이하다.

기존에는 비정형 데이터 품질을 정량적으로 평가하고 자동 개선하는 기술이 국내외에서 부족했던 반면, 데이터 클리닉은 이 과정을 하나의 통합 솔루션으로 구현해 데이터 거버넌스 전반을 사전 통제형으로 전환시킬 수 있다. 특히 공공데이터 품질 평가 항목이 AI 적합성, 합성데이터 활용, 행정사례 중심으로 개편되면서 해당 솔루션은 공공기관의 데이터 준비 상태를 AI 활용 가능 상태(AI Ready)로 끌어올리는 데 효과적이다. 이 제품은 허용된 사용자 환경 내에서 대용량 데이터에 대한 품질 검사부터 개선과 결과 시각화까지 전 과정을 일관되게 수행할 수 있는 기능을 포함하고 있다.

공공부문 실증과 조달 확대 추진

페블러스는 7월 1일부터 조달청 시범구매사업에 참여해 전국 공공기관과 실증 프로젝트를 순차적으로 추진하고 있다. 이번 조달청 혁신제품 지정은 민간이 보유한 신기술로 공공수요를 해결할 수 있는 가능성을 인정받은 제품에 부여되는 자격으로, 시범구매, 수의계약 등 공공시장 진입을 위한 제도적 지원이 뒤따른다. 페블러스는 이 기회를 통해 데이터 클리닉을 전국 공공기관의 실제 운영 환경에 적용하고, 공공부문의 디지털 전환을 실질적으로 지원할 계획이다.

페블러스의 이주행 대표는 “정량적 평가가 가능한 비정형 데이터 품질관리 기술은 국내에서 처음 시도되는 영역이며, 이번 지정은 공공 AI 인프라에서 데이터 품질을 ‘내용 중심’으로 관리하는 새로운 패러다임의 시작”이라고 말했다. 또한 이정원 부대표는 “신뢰할 수 있는 데이터가 데이터 기반 행정의 핵심이며, 데이터 클리닉은 이를 AI 적합 상태로 전환하는 기술로서 공공의 디지털 혁신을 뒷받침하고 있다”고 강조했다.

페블러스는 한국전자통신연구원(ETRI) 출신 연구진이 설립한 기업으로, 2023년에는 AWS 마켓플레이스를 통해 글로벌 시장에 진출했으며, 이번 조달청 혁신제품 지정을 계기로 국내 조달시장에서도 기술력과 공공성을 동시에 인정받았다. 아울러 가트너(Gartner)의 2025년 보고서에도 ‘합성데이터 기반 품질 진단 기업’으로 세 차례 언급되며 글로벌 기술 경쟁력을 재확인한 바 있다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지