AI 데이터셋에 등록된 데이터에 대해, GDPR, CCPA 등 개인 정보 보호 규정에 따라 사용자는 자신의 데이터 삭제를 요구할 수 있으며, 모델 학습에 사용된 데이터에 민감한 개인 정보가 포함되어 있을 경우, 모델 자체를 통해 정보가 유출될 위험이 있다.
또한, 시간이 지남에 따라 데이터의 분포가 변하거나, 모델 성능에 부정적인 영향을 미치는 오래되거나 부정확한 데이터가 포함될 수 있으며, 이러한 AI의 데이터를 지우고 데이터 편향 및 악의적 데이터를 제거하는 ‘머신 언러닝’ 서비스가 등장하고 있다.
머신 언러닝 스타트업 히룬도(Hirundo, CEO 벤 루리아)가 처음부터 다시 학습할 필요 없이 편향, 환각등의 위험과 같은 AI 모델의 원치 않는 데이터 또는 동작을 관리하는 ‘머신 언러닝 플랫폼’을 발표했다.

머신 언러닝 플랫폼을 통해, 메타의 1090억 개의 파라미터로 구성된 16개의 전문가 혼합(MoE) 아키텍처를 활용하는 1700억 개의 파라미터 모델 ‘라마 4(스카우트)’의 편향을 평균 44% 줄였다
이 모델은 기본 멀티모달 기능, 텍스트와 이미지를 효율적으로 처리하는 능력, 최대 1000만 개의 토큰에 달하는 컨텍스트 창 지원으로 주목받았다.
머신 언러닝은 기존의 재학습 없이 특정 행동이나 정보를 AI 모델에서 제거하는 기술로, ‘AI가 특정 지식을 잊도록 만든다’는 개념에 기반한다. 히룬도의 머신 언러닝 방법론은 편향 완화를 넘어 환각, 적대적 취약성, 유해한 출력과 같은 주요 AI 동작을 효과적으로 해결한다. 기업과 데이터 과학자는 히룬도의 사용자 정의 가능한 플랫폼을 활용해 진화하는 윤리적 기준 및 규제 요구 사항에 따라 AI 모델을 효율적으로 조정할 수 있다.
히룬도의 CEO인 벤 루리아(Ben Luria)는 “편향 감소는 첨단 AI 모델의 책임감 있는 채택에 필수적이다.”라며 “라마 4와의 협력은 우리 플랫폼의 견고성과 확장성을 입증하며, 조직이 더 안전하고 공정한 AI 솔루션을 배포하도록 돕겠다는 우리의 약속을 강화한다.”라고 말했다.
관련기사
- AI 시대를 주도할 기업 필수 ‘데이터 활용 및 보안 솔루션’
- 폭증하는 AI 위협 해결사 ‘IBM 데이터 시큐리티 센터’...데이터 보안과 거버넌스 향상
- 헬스케어·바이오 산업, 생성AI ‘데이터 보안·거버넌스’ 문제 ‘합성 데이터’로 해결
- 데이터브릭스-팔란티어, AI 모델 최적화·데이터 거버넌스 강화 협력
- 데이터 통합 플랫폼에 결합된 ‘AI 기반 데이터 거버넌스’...데이터 무결성 유지
- 생성 AI, 데이터 팀 생산성 최대 50% 향상....‘보안·거버넌스·신뢰’ 유지 관건
- AI 기반 ‘침해 사고 대응 플랫폼’...빠르고 경제적 침해 대응·규정준수 보장
- 비즈니스 극대화하는 ‘데이터 프로비저닝 AI 도입 전략’
- ‘모듈식 자율형 데이터 에이전트’, 실시간 AI 인텔리전스 정확도↑비용↓
- AI 도입 가속이 데이터 예산 확대와 팀 역량 강화
- 기업 AI 도입 핵심 플랫폼으로 급성장하는 대규모 언어모델 운영(LLMOps) 소프트웨어
- 기업 맞춤형 LLM 기술, 기업 자동화와 ROI 혁신
- 기업들이 주목하는 AI 환각·편향 제거 ‘머신 언러닝’ 기술
- 생성AI 편향, 기업 수익과 신뢰를 동시에 위협
