디지털 시대에서 데이터는 기업의 핵심 자산으로 자리 잡았지만, 데이터 품질 저하는 AI 성능 저하와 운영 비효율을 초래하는 주요 원인이다. 특히 AI 모델의 학습에 사용되는 데이터의 신뢰성과 정밀성이 부족할 경우, 기업들은 비효율적인 의사결정을 내릴 가능성이 커진다. 이에 따라 데이터 품질을 체계적으로 진단하고 관리하는 솔루션이 필수적이며, 페블러스의 ‘데이터 클리닉’이 이러한 요구에 부합하는 혁신적인 기술로 주목받고 있다.
페블러스는 ‘데이터 클리닉(Data Clinic)’ 서비스를 통해 기업들이 보유한 데이터를 종합적으로 진단하고 최적화하는 방안을 제공한다. 데이터 클리닉은 ▲데이터 품질 진단 ▲정밀 타기팅 합성데이터 생성 ▲데이터 다이어트 및 중복 제거 ▲비정형 데이터 관리 등을 통해 AI 성능을 극대화하는 것을 목표로 한다.
이주행 대표는 “기업이 건강을 위해 정기 건강검진을 받듯, 데이터도 정기적으로 품질 진단을 받아야 한다.”라며 데이터 관리의 중요성을 강조했다.

데이터 품질 개선을 통한 AI 성능 향상 사례
페블러스의 데이터 클리닉은 실제 기업들의 AI 성능 개선에 기여하고 있다. A사는 차량 센서 데이터를 활용한 위치 추정 AI 개발 과정에서 데이터 취득의 어려움을 겪었으나, 페블러스의 데이터 품질 진단과 정밀 타겟팅 합성데이터 생성을 통해 데이터 취득 기간을 15일에서 1시간으로 단축하고, AI 성능을 200% 향상시켰다.
또한, B사는 가상 아이돌 제작을 위한 얼굴 캡처 시스템 개발 중 중복된 데이터 문제로 인해 AI 학습시간이 증가하는 문제를 경험했으나, 페블러스의 데이터 다이어트 및 최적화 과정을 거쳐 데이터 용량을 15% 줄이고 AI 학습시간을 1주일에서 1일로 단축할 수 있었다.
가트너 보고서에서 인정받은 데이터 품질 관리 기술
페블러스의 데이터 품질 관리 기술은 2025년 2월 18일 발표된 가트너 보고서 "Develop Unstructured Data Management Capabilities to Support GenAI-Ready Data(G00821728)"에서도 언급되었다. 보고서에서는 비정형 데이터 관리의 중요성이 커지고 있으며, 고품질 데이터 확보를 위해 정교한 품질 진단 및 관리 솔루션이 필요하다고 강조했다.
특히 페블러스는 글로벌 데이터 품질 측정 기업인 어노말로(Anomalo) 및 쉘프아이오(Shelf.io)와 함께 신뢰할 수 있는 데이터 품질 관리 솔루션 제공자로 선정되며 기술력을 입증받았다.
보고서는 AI와 데이터 분석 프로젝트에서 사용되는 데이터의 60%가 합성 데이터로 대체되고 있으며, 이로 인해 데이터 품질의 중요성이 더욱 강조된다고 지적했다. 또한, 페블러스의 정밀 타기팅 합성데이터 기술이 실제 취득이 어려운 데이터를 생성하여 AI 모델의 성능을 극대화하는 데 기여하고 있으며, 이 기술이 가트너의 향후 보고서에서도 우수 사례로 소개될 예정이라고 밝혔다.
정밀 타겟팅 합성데이터 기술과 3D 대화형 데이터 탐색 시스템 ‘페블로스코프’
페블러스의 데이터 클리닉 서비스는 ‘진단 렌즈’ 기술을 통해 데이터를 다차원적으로 분석한다. 사람이 육안으로 판단하기 어려운 데이터 품질 문제를 AI 기반 분석을 통해 도출하며, 데이터의 균질성, 밀도, 편향성, 결측치 등을 자동으로 평가한다.

또한, 데이터 품질 진단 결과는 정형화된 보고서 형태로 제공되며, 10만 개 이상의 데이터셋을 1시간 이내에 분석할 수 있다. 이 과정에서 정밀 타겟팅 합성데이터 기술이 활용되며, 실제 취득이 어려운 데이터도 생성 AI를 통해 생산함으로써 데이터 품질을 향상시키고 AI 성능을 극대화할 수 있다.
3D 대화형 데이터 탐색 시스템 ‘페블로스코프(Pebbloscope)’는 방대한 데이터를 효율적으로 탐색하고 활용할 수 있다. 대부분의 데이터는 고차원 형태로 존재하며 직관적인 분석이 어려운 문제점을 가진다.
페블로스코프는 페블러스의 데이터 렌즈 기술을 활용하여 데이터를 저차원으로 변환하고, 3D 시각화를 통해 사용자가 데이터의 구조와 특성을 직관적으로 파악할 수 있도록 돕는다. 또한, 다중 속성 탐색 기능을 제공해 데이터의 관계를 분석하고, 드래그 앤 드롭 방식의 사용자 친화적 인터페이스(UI)를 지원해 누구나 쉽게 데이터를 탐색할 수 있도록 설계되었다.
페블러스는 CES 2025 및 MWC 2025 참가를 계기로 데이터 클리닉 SaaS 서비스를 공식 출시했다. ‘dataclinic.ai’를 통해 데이터 품질 진단, 요금 안내, 샘플 진단 보고서 제공 등의 기능을 제공하며, 고객들은 플랫폼에서 직접 데이터 품질 진단을 체험할 수 있다. 또한, API 기반 SaaS 서비스 및 온프레미스 방식의 ‘Pebblous-to-Go’ 방문 진단 서비스도 계획하고 있다.
페블러스는 현재 23건의 연구 과제를 수행하고 있으며, 36건의 국내 특허 및 3건의 미국 특허를 보유하고 있다. 향후 금융, 헬스케어, 공공 행정 분야에서도 데이터 품질 평가 및 생성 서비스를 확대해 나갈 예정이다. 데이터가 인공지능 성능의 90%를 결정한다는 원칙 아래, 페블러스는 데이터 품질 관리의 혁신을 지속적으로 주도할 계획이다.
관련기사
- "기업 데이터 혁신의 해법! 3월 27일 ‘DISS 2025’에서 데이터와 AI 통합 성공 전략 제시”
- "비즈니스 혁신하는 기업 맞춤형 데이터와 AI 통합 전략" 컨퍼런스 3월 27일 개최
- 페블러스, ‘2025 데이터바우처 지원사업’ 공급기관 선정
- 페블러스, MWC 2025서 인터랙티브 데이터 시각화·분석 도구 ‘페블로스코프’ 공개
- 페블러스-고려대 정보대학, 'AI 데이터 품질' 산학 역량 강화 협력
- 기업 비즈니스 혁신에 필요한 AI 솔루션에 주목하라
- [한선화의 소소(昭疏)한 과학] 우리가 알아야 할 딥페이크
- “NABS 2024, 글로벌 빅테크가 전하는 비즈니스 혁신 AI·빅데이터 실용 전략”
- “분산된 데이터, 불확실한 보안...AI 시대 기업의 해답, DISS 2025에서 찾는다”
- 데이터 흐름·보안·AI를 하나로…엔드 투 엔드 옵저버빌리티 플랫폼 ‘데이터독’
- 수호아이오-페블러스, 블록체인 기반 보상형 AI 데이터 플랫폼 구축 협력
- AI 시대를 주도할 기업 필수 ‘데이터 활용 및 보안 솔루션’
- AI 헬스케어 수요 예측 플랫폼...실시간 미디어 구매·건강 데이터 통합해 광고효과 극대화
- 정확도·생산성 높이는 ‘시각적 AI 개발 워크플로’...데이터 품질 개선·모델 분석 간소화로 대규모 AI 구축 가속
- 페블러스, 비정형 데이터 진단·개선 솔루션 ‘데이터 클리닉’ 조달청 혁신제품 지정
- 페블러스, 과기정통부 ‘글로벌 빅테크 육성사업’ 선정...세계 수준 AADS 플랫폼 목표
- 자율형 AI 데이터 과학자 AADS...데이터 관리 엔드투엔드 자동화 혁신
