인공지능(AI) 기술이 빠르게 발전하면서 AI 모델을 훈련시키기 위한 고품질 데이터 확보가 중요한 과제로 떠오르고 있다. 특히 데이터 수집 및 주석 작업의 높은 비용과 개인 정보 보호 문제로 인해 AI 연구 및 개발이 제약을 받는 경우가 많다.
이러한 한계를 극복하기 위해 최근 합성 데이터(Synthetic Data) 기술이 주목받고 있으며, 이는 현실 세계를 반영하면서도 개인정보 보호 및 규제 준수를 보장하는 대안으로 자리 잡고 있다. 기존의 데이터 수집 방식과 달리, 합성 데이터는 실제 데이터를 모방하여 생성되며, 이를 통해 AI 모델의 훈련을 보다 정밀하고 안전하게 수행할 수 있다.
글로벌 데이터 서비스 제공 기업 스마트원에이아이(SmartOne.ai)가 AI 모델 학습을 재구성하는 합성 데이터 서비스를 발표했다.
스마트원에이아이의 합성 데이터 서비스는 금융, 의료, 법률 기술 및 자동화를 포함하여 특정하고 중요한 데이터 요구 사항이 있는 산업에 맞춰 제공된다. 글꼴, 손글씨, 서명 및 레이아웃으로 완성된 문서 구조를 생성해 사기 탐지, KYC 규정 준수 및 자동화 테스트를 위한 리소스를 지원한다.

GDPR 및 HIPAA와 같은 데이터 개인 정보 보호 규정이 강화됨에 따라 완전히 합성되었지만 매우 현실적인 데이터 세트를 제공해 AI 개발자가 법적 문제 없이 모델을 학습할 수 있도록 지원한다.
한편, 시뮬레이션과 현실 간의 격차를 해소하기 위해 블렌더(Blender), 퀵셀 메가스캔(Quixel Megascans) 및 유니티(Unity)와 같은 도구를 사용하며 컴퓨터 비전, NLP, 자율 시스템 및 문서 처리와 같은 다양한 AI 기반 분야에 적용할 수 있는 학습 데이터 세트를 제공한다.
스마트원에이아이의 CEO 에릭 라자(Eric Raza)는 “AI 혁신은 가속하고 있지만 데이터는 모든 혁신의 기반으로 남아 있다.”라며 “스마트원에이아이는 AI의 미래는 최고 품질, 가장 다양하고 윤리적으로 공급된 데이터로 모델을 학습하고 평가할 수 있는 사람들에게 있다고 믿는다.”라고 전했다.
관련기사
- IBM, 멀티모달·추론 가능한 ‘그래니트 AI 모델’ 출시
- 사이냅소프트-디딤365, AI 사업 협력 강화...공공 및 민간 AI 시장 확대
- 160개 언어 지원 ‘AI·인간 전문성’ 결합 이메일 자동화 플랫폼...고객 문의 응답 시간 70% 단축, 수작업 이메일 처리량 85% 감소
- 페블러스, MWC 2025서 인터랙티브 데이터 시각화·분석 도구 ‘페블로스코프’ 공개
- 씨이랩, 합성 데이터 품질인증 최고등급 ‘Class A’ 획득
- “업무용 PC 사용자 68%, AI PC로 전환 의향 有”
- ML 기반 단층 지진 데이터 분석 AI 플랫폼...“수 개월 자원 탐사, 며칠로 단축”
- 데이터 비용 1/10로 줄고 개발은 10배 빠른 ‘합성 데이터 생성 도구’
- 헬스케어·바이오 산업, 생성AI ‘데이터 보안·거버넌스’ 문제 ‘합성 데이터’로 해결
- 로봇 눈이 된 '다중 센서 융합 AI 카메라'...산업 로봇 자율화 시대 가속
