공공 부문에서 인공지능(AI)을 활용한 데이터 기반 행정의 수요가 증가하면서, AI 학습에 필요한 고품질 데이터 확보가 핵심 과제로 부상하고 있다. 특히 텍스트, 이미지, 음성 등 비정형 데이터는 오류, 편향, 왜곡 등의 문제가 데이터 신뢰성과 모델 성능에 직접적인 영향을 미치고 있다. 이에 따라 AI 학습 전에 데이터 품질을 정량적으로 진단하고 개선할 수 있는 자동화된 솔루션에 대한 수요가 빠르게 늘어나고 있으며, 정부 역시 AI 친화적인 공공데이터 평가 지표를 도입해 대응에 나서고 있다.
AI 데이터 솔루션 전문기업 페블러스(Pebblous)는 데이터 품질 진단 및 개선 솔루션인 ‘데이터 클리닉(Data Clinic)’이 조달청 혁신제품으로 지정됐다고 발표했다. 데이터 클리닉은 텍스트, 이미지, 음성 등 다양한 비정형 데이터의 품질을 AI 기반 전수조사 방식으로 자동 진단하고, 합성 데이터 추가, 경량화 등을 통해 품질을 개선한 후, 결과를 시각화하는 올인원 품질 관리 솔루션이다. 이 제품은 특히 공공 AI 학습용 데이터의 신뢰성 확보를 위한 핵심 도구로 주목받고 있다.

AI 기반 자동 진단과 정량적 평가 기술 확보
데이터 클리닉은 비정형 데이터에 포함된 노이즈, 오류, 중복, 편향, 왜곡 등의 문제를 AI가 자동으로 탐지하고, 이에 기반해 데이터의 구조를 분석한 후 적절한 품질 개선 작업을 수행한다. 특히 데이터에 따라 합성 데이터를 추가하거나 불필요한 데이터를 제거해 경량화를 진행하며, 데이터 품질을 시각적으로 표현할 수 있는 페블로스코프(Pebbloscope) 기능을 제공해 데이터 품질 진단과 개선 결과를 직관적으로 파악할 수 있도록 한다. 사용자는 데이터의 흐름과 품질 상태를 인터랙티브하게 확인할 수 있어, AI 학습 전 단계에서 품질 통제 및 커뮤니케이션이 용이하다.
기존에는 비정형 데이터 품질을 정량적으로 평가하고 자동 개선하는 기술이 국내외에서 부족했던 반면, 데이터 클리닉은 이 과정을 하나의 통합 솔루션으로 구현해 데이터 거버넌스 전반을 사전 통제형으로 전환시킬 수 있다. 특히 공공데이터 품질 평가 항목이 AI 적합성, 합성데이터 활용, 행정사례 중심으로 개편되면서 해당 솔루션은 공공기관의 데이터 준비 상태를 AI 활용 가능 상태(AI Ready)로 끌어올리는 데 효과적이다. 이 제품은 허용된 사용자 환경 내에서 대용량 데이터에 대한 품질 검사부터 개선과 결과 시각화까지 전 과정을 일관되게 수행할 수 있는 기능을 포함하고 있다.
공공부문 실증과 조달 확대 추진
페블러스는 7월 1일부터 조달청 시범구매사업에 참여해 전국 공공기관과 실증 프로젝트를 순차적으로 추진하고 있다. 이번 조달청 혁신제품 지정은 민간이 보유한 신기술로 공공수요를 해결할 수 있는 가능성을 인정받은 제품에 부여되는 자격으로, 시범구매, 수의계약 등 공공시장 진입을 위한 제도적 지원이 뒤따른다. 페블러스는 이 기회를 통해 데이터 클리닉을 전국 공공기관의 실제 운영 환경에 적용하고, 공공부문의 디지털 전환을 실질적으로 지원할 계획이다.
페블러스의 이주행 대표는 “정량적 평가가 가능한 비정형 데이터 품질관리 기술은 국내에서 처음 시도되는 영역이며, 이번 지정은 공공 AI 인프라에서 데이터 품질을 ‘내용 중심’으로 관리하는 새로운 패러다임의 시작”이라고 말했다. 또한 이정원 부대표는 “신뢰할 수 있는 데이터가 데이터 기반 행정의 핵심이며, 데이터 클리닉은 이를 AI 적합 상태로 전환하는 기술로서 공공의 디지털 혁신을 뒷받침하고 있다”고 강조했다.
페블러스는 한국전자통신연구원(ETRI) 출신 연구진이 설립한 기업으로, 2023년에는 AWS 마켓플레이스를 통해 글로벌 시장에 진출했으며, 이번 조달청 혁신제품 지정을 계기로 국내 조달시장에서도 기술력과 공공성을 동시에 인정받았다. 아울러 가트너(Gartner)의 2025년 보고서에도 ‘합성데이터 기반 품질 진단 기업’으로 세 차례 언급되며 글로벌 기술 경쟁력을 재확인한 바 있다.
관련기사
- AI 시대를 주도할 기업 필수 ‘데이터 활용 및 보안 솔루션’
- 수호아이오-페블러스, 블록체인 기반 보상형 AI 데이터 플랫폼 구축 협력
- “분산된 데이터, 불확실한 보안...AI 시대 기업의 해답, DISS 2025에서 찾는다”
- 인공지능 데이터 품질 혁신하는 SaaS형 ‘데이터 클리닉’
- "기업 데이터 혁신의 해법! 3월 27일 ‘DISS 2025’에서 데이터와 AI 통합 성공 전략 제시”
- "비즈니스 혁신하는 기업 맞춤형 데이터와 AI 통합 전략" 컨퍼런스 3월 27일 개최
- 페블러스, ‘2025 데이터바우처 지원사업’ 공급기관 선정
- 페블러스, MWC 2025서 인터랙티브 데이터 시각화·분석 도구 ‘페블로스코프’ 공개
- AI 기억상실 해결하는 지속형 대화 메모리 기술, 기업용 생성AI 인프라 혁신
- 비정형 데이터 구조화 기술...에이전틱 AI ‘인식과 추론·자동화 정확도’ 향상
- AI 기반 실시간 데이터 품질 관리 플랫폼...기업 경쟁력·데이터 거버넌스 강화
- AI 성공하려면 데이터 거버넌스 현실 점검 시급
- 멀티환경 지원 AI 에이전트로 데이터 활용과 수익 창출 강화
- 페블러스, 과기정통부 ‘글로벌 빅테크 육성사업’ 선정...세계 수준 AADS 플랫폼 목표
- 자율형 AI 데이터 과학자 AADS...데이터 관리 엔드투엔드 자동화 혁신
- 대용량 CSV 처리 혁신...분할 자동화로 기업 데이터 활용 극대화
- 기간 70% 단축·정확도 95% ‘합성 데이터셋 구축 서비스’...규제 산업 품질·컴플라이언스 강화
- 데이터와 AI 기반 공공부문 조직관리 부상…정부조직 효율화 새 패러다임 제시
