AI 데이터셋에 등록된 데이터에 대해, GDPR, CCPA 등 개인 정보 보호 규정에 따라 사용자는 자신의 데이터 삭제를 요구할 수 있으며, 모델 학습에 사용된 데이터에 민감한 개인 정보가 포함되어 있을 경우, 모델 자체를 통해 정보가 유출될 위험이 있다.

또한, 시간이 지남에 따라 데이터의 분포가 변하거나, 모델 성능에 부정적인 영향을 미치는 오래되거나 부정확한 데이터가 포함될 수 있으며, 이러한 AI의 데이터를 지우고 데이터 편향 및 악의적 데이터를 제거하는 ‘머신 언러닝’ 서비스가 등장하고 있다.

머신 언러닝 스타트업 히룬도(Hirundo, CEO 벤 루리아)가 처음부터 다시 학습할 필요 없이 편향, 환각등의 위험과 같은 AI 모델의 원치 않는 데이터 또는 동작을 관리하는 ‘머신 언러닝 플랫폼’을 발표했다.

머신 언러닝 플랫폼을 통해, 메타의 1090억 개의 파라미터로 구성된 16개의 전문가 혼합(MoE) 아키텍처를 활용하는 1700억 개의 파라미터 모델 ‘라마 4(스카우트)’의 편향을 평균 44% 줄였다

이 모델은 기본 멀티모달 기능, 텍스트와 이미지를 효율적으로 처리하는 능력, 최대 1000만 개의 토큰에 달하는 컨텍스트 창 지원으로 주목받았다.

머신 언러닝은 기존의 재학습 없이 특정 행동이나 정보를 AI 모델에서 제거하는 기술로, ‘AI가 특정 지식을 잊도록 만든다’는 개념에 기반한다. 히룬도의 머신 언러닝 방법론은 편향 완화를 넘어 환각, 적대적 취약성, 유해한 출력과 같은 주요 AI 동작을 효과적으로 해결한다. 기업과 데이터 과학자는 히룬도의 사용자 정의 가능한 플랫폼을 활용해 진화하는 윤리적 기준 및 규제 요구 사항에 따라 AI 모델을 효율적으로 조정할 수 있다.

히룬도의 CEO인 벤 루리아(Ben Luria)는 “편향 감소는 첨단 AI 모델의 책임감 있는 채택에 필수적이다.”라며 “라마 4와의 협력은 우리 플랫폼의 견고성과 확장성을 입증하며, 조직이 더 안전하고 공정한 AI 솔루션을 배포하도록 돕겠다는 우리의 약속을 강화한다.”라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지