인공지능(AI) 기술이 빠르게 발전하면서 AI 모델을 훈련시키기 위한 고품질 데이터 확보가 중요한 과제로 떠오르고 있다. 특히 데이터 수집 및 주석 작업의 높은 비용과 개인 정보 보호 문제로 인해 AI 연구 및 개발이 제약을 받는 경우가 많다.

이러한 한계를 극복하기 위해 최근 합성 데이터(Synthetic Data) 기술이 주목받고 있으며, 이는 현실 세계를 반영하면서도 개인정보 보호 및 규제 준수를 보장하는 대안으로 자리 잡고 있다. 기존의 데이터 수집 방식과 달리, 합성 데이터는 실제 데이터를 모방하여 생성되며, 이를 통해 AI 모델의 훈련을 보다 정밀하고 안전하게 수행할 수 있다.

글로벌 데이터 서비스 제공 기업 스마트원에이아이(SmartOne.ai)가 AI 모델 학습을 재구성하는 합성 데이터 서비스를 발표했다.

스마트원에이아이의 합성 데이터 서비스는 금융, 의료, 법률 기술 및 자동화를 포함하여 특정하고 중요한 데이터 요구 사항이 있는 산업에 맞춰 제공된다. 글꼴, 손글씨, 서명 및 레이아웃으로 완성된 문서 구조를 생성해 사기 탐지, KYC 규정 준수 및 자동화 테스트를 위한 리소스를 지원한다.

GDPR 및 HIPAA와 같은 데이터 개인 정보 보호 규정이 강화됨에 따라 완전히 합성되었지만 매우 현실적인 데이터 세트를 제공해 AI 개발자가 법적 문제 없이 모델을 학습할 수 있도록 지원한다.

한편, 시뮬레이션과 현실 간의 격차를 해소하기 위해 블렌더(Blender), 퀵셀 메가스캔(Quixel Megascans) 및 유니티(Unity)와 같은 도구를 사용하며 컴퓨터 비전, NLP, 자율 시스템 및 문서 처리와 같은 다양한 AI 기반 분야에 적용할 수 있는 학습 데이터 세트를 제공한다.

스마트원에이아이의 CEO 에릭 라자(Eric Raza)는 “AI 혁신은 가속하고 있지만 데이터는 모든 혁신의 기반으로 남아 있다.”라며 “스마트원에이아이는 AI의 미래는 최고 품질, 가장 다양하고 윤리적으로 공급된 데이터로 모델을 학습하고 평가할 수 있는 사람들에게 있다고 믿는다.”라고 전했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지