복잡한 데이터세트를 다룰 때 단일 AI 모델에 의존하는 것은 AI의 예측 능력을 크게 저하시키는 중대한 단점이 있다. 모델을 결합하는 것은 AI 분야에서 ‘앙상블링’이라고 한다. 지난 30년간 앙상블 학습은 불균형한 데이터세트, 많은 수의 노이즈와 분산된 데이터 포인트를 포함하는 데이터세트 또는 관찰 수에 비해 특성 수가 많은 데이터세트를 다루는 주요 방법으로 부상했다.

그러나 개별 모델들을 하나의 일관된 전체 패러다임으로 결합하는 것은 AI 분야의 여전한 과제이다. 앙상블링을 위한 가장 일반적인 접근법으로는 단순 투표, 가중 다수결 투표(WMVE), 그리고 현재 최첨단 기술로 알려진 클래스별 소프트 투표(CSSV) 등이 있다.

임상 단계의 기술 중심 제약 업체인 버시온 인터내셔널(Verseon International)은 새롭게 개발한 클래스 가중치 앙상블 시스템(CWES)을 특허 출원 중인 ‘버스AI(VersAI)’ 기술에 통합했다. 최근 머신러닝 모델을 결합하는 근본적 혁신에 대한 동료 심사 결과를 발표했다.

‘높은 변동성을 지닌 클래스 기반 성능의 앙상블 학습’이라는 논문에서 버시온 팀은 자사가 새롭게 개발한 기술을 설명하고 이를 단순 투표, WMVE, CSSV와 대조했다. 다른 접근법들과 달리 버시온의 CWES는 각 모델의 예측을 기반으로 모델 세트를 결합하는 방법을 결정한다.

CWES는 각 모델의 예측에 대한 중요도를 유사한 훈련 데이터에 대한 성능 분석을 바탕으로 동적으로 할당하기 때문에 복잡한 데이터 분석에 뛰어나다. 논문에 보고된 벤치마킹 결과에 따르면 CWES는 광범위한 데이터세트에서 다른 앙상블링 기법들보다 우수한 성능을 보였다.

CWES는 데이터세트가 일반적으로 복잡하거나 희소하거나, 혹은 두 가지 특성을 모두 가지고 있는 대부분의 실제 시나리오에 폭넓게 적용 가능하다. CWES는 이러한 데이터세트를 더욱 다루기 쉽게 만들어 광범위한 시나리오에서 AI 모델링의 유용성을 크게 확장한다. 저분자 신약 발견 분야가 바로 그러한 시나리오 중 하나이다.

버시온의 CEO인 아디토 프라카시(Adityo Prakash)는 “새로운 앙상블링 접근법은 여러 분야에 광범위하게 적용할 수 있다. 이는 미래의 획기적인 치료법을 위한 유망한 약물 후보를 계속해서 찾아낼 수 있는 방법”이라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지