복잡한 데이터세트를 다룰 때 단일 AI 모델에 의존하는 것은 AI의 예측 능력을 크게 저하시키는 중대한 단점이 있다. 모델을 결합하는 것은 AI 분야에서 ‘앙상블링’이라고 한다. 지난 30년간 앙상블 학습은 불균형한 데이터세트, 많은 수의 노이즈와 분산된 데이터 포인트를 포함하는 데이터세트 또는 관찰 수에 비해 특성 수가 많은 데이터세트를 다루는 주요 방법으로 부상했다.
그러나 개별 모델들을 하나의 일관된 전체 패러다임으로 결합하는 것은 AI 분야의 여전한 과제이다. 앙상블링을 위한 가장 일반적인 접근법으로는 단순 투표, 가중 다수결 투표(WMVE), 그리고 현재 최첨단 기술로 알려진 클래스별 소프트 투표(CSSV) 등이 있다.
임상 단계의 기술 중심 제약 업체인 버시온 인터내셔널(Verseon International)은 새롭게 개발한 클래스 가중치 앙상블 시스템(CWES)을 특허 출원 중인 ‘버스AI(VersAI)’ 기술에 통합했다. 최근 머신러닝 모델을 결합하는 근본적 혁신에 대한 동료 심사 결과를 발표했다.

‘높은 변동성을 지닌 클래스 기반 성능의 앙상블 학습’이라는 논문에서 버시온 팀은 자사가 새롭게 개발한 기술을 설명하고 이를 단순 투표, WMVE, CSSV와 대조했다. 다른 접근법들과 달리 버시온의 CWES는 각 모델의 예측을 기반으로 모델 세트를 결합하는 방법을 결정한다.
CWES는 각 모델의 예측에 대한 중요도를 유사한 훈련 데이터에 대한 성능 분석을 바탕으로 동적으로 할당하기 때문에 복잡한 데이터 분석에 뛰어나다. 논문에 보고된 벤치마킹 결과에 따르면 CWES는 광범위한 데이터세트에서 다른 앙상블링 기법들보다 우수한 성능을 보였다.
CWES는 데이터세트가 일반적으로 복잡하거나 희소하거나, 혹은 두 가지 특성을 모두 가지고 있는 대부분의 실제 시나리오에 폭넓게 적용 가능하다. CWES는 이러한 데이터세트를 더욱 다루기 쉽게 만들어 광범위한 시나리오에서 AI 모델링의 유용성을 크게 확장한다. 저분자 신약 발견 분야가 바로 그러한 시나리오 중 하나이다.
버시온의 CEO인 아디토 프라카시(Adityo Prakash)는 “새로운 앙상블링 접근법은 여러 분야에 광범위하게 적용할 수 있다. 이는 미래의 획기적인 치료법을 위한 유망한 약물 후보를 계속해서 찾아낼 수 있는 방법”이라고 말했다.
관련기사
- 전세계 조직을 위협하는 “독성 클라우드 노출 주의보”
- 위험 분석 통합된 ‘제3자 위험 관리 솔루션’...시간·비용·복잡성↓보안성↑
- 자동화·인간 전문성 결합한 ‘AI 챗봇’...“고객 경험 극대화”
- 국내 조직 78%, ‘생성AI’ 도입으로 업무 생산성 개선돼
- 제조 기업 필수 9대 ‘고급 보안 솔루션’
- “스타트업이 AI 금융 서비스 변혁을 주도할 것”
- 고객 및 직원 만족도 높이는 인력관리 생성AI 플랫폼
- 비즈니스 자동화에 AI 도입 성공 조건, "컨텍스트·모델·실행 가능성·신뢰"
- LLM 환각 해결한 ‘신뢰할 수 있는 언어 모델’
- GPT 알고리듬·AI 결합 ‘단 몇 초 만에 설문조사 생성’
- 구글 및 AI 검색 엔진 상위 노출 전략
- 머신러닝 테스트 및 평가로 실패하지 않은 ML 모델 개발
- 익스피리언, 모델링 수명 주기 단축 AI 솔루션 출시
- 데이터 통합 가속화로 ‘데이터 메시’ 급부상
- 데이터 분석·통찰력 극대화 '지능형 데이터 분석 플랫폼'
- 빅데이터·AI·클라우드 발전에 힘입어 ‘고성능 데이터 분석’ 수요 껑충
- ‘데이터 중심 콘텐츠’가 디지털 마케팅의 미래
- 기업을 성공시키는 검색 엔진 최적화 전략
- 브랜드·검색엔진 순위 높이는 데이터 중심 ‘산업별 맞춤형 전문 SEO 서비스’
- ‘구글 페이지 주석 기능’ 종료...SEO 최적화 대체 전략 시급
