전 세계적으로 디지털 정보의 양은 폭발적으로 증가하고 있지만, 그만큼 언어 불균형과 데이터 편향 문제도 심화되고 있다. 예를 들어 위키피디아에는 약 7백만 개의 영어 문서가 존재하지만, 스와힐리어 문서는 4만 개에 불과하다. 이로 인해 수억 명의 사용자가 자신들의 언어로 검증된 정보를 얻지 못하는 상황이다. 

또한 대규모 생성AI가 만들어내는 콘텐츠는 데이터 진위성 검증이 어렵고, 출처가 불분명한 정보가 혼재돼 있다. 이 같은 상황에서 진실 기반의 지식 생성을 목표로 한 AI 기술의 필요성이 커지고 있다.

글로벌 경영대학원 인시아드(INSEAD, The Business School for the World)가 AI 기반 백과사전 포털 ‘보티피디아(Botipedia)’를 공개했다고 밝혔다.

이번 프로젝트는 ‘진실 탐구형 AI(Truth-seeking AI)’를 통해 인간의 집단 지식 구축 방식을 대체할 새로운 모델을 제시한다.

인간 편집 과정 모사하는 AI 지식 생성 구조

보티피디아는 수백 개의 독자 알고리듬을 결합한 ‘다중방법 생성(Dynamic Multi-method Generation, DMG)’ 기술로 구동된다. 이 기술은 인간 편집자가 수집·검증·요약하는 과정을 모사하며, 각 항목을 데이터 기반으로 자동 생성한다. 

단일 대형언어모델(LLM)에 의존하지 않고, 콘텐츠 유형에 따라 서로 다른 생성 방식을 선택한다. 예를 들어 기상 데이터나 위치 정보는 위도·경도를 기준으로 지리 공간 알고리듬으로 생성하고, 역사·정치·경제 주제는 신뢰 가능한 원문을 직접 인용한다.

보티피디아는 인시아드가 보유한 대규모 데이터셋과 위성 피드, 공공 아카이브를 결합해 방대한 양의 검증 가능한 정보를 생성한다. 그 결과 100개 이상의 언어로 약 4000억 개의 백과 항목을 제공하며, 기존 위키피디아(영문 약 6400만 문서)보다 6000배 이상 많은 규모다.

출처 기반 생성 구조

DMG 기술은 각 생성 결과의 데이터 출처를 명시하고, 인용 구조를 투명하게 공개한다. 이를 통해 사용자는 하나의 정답이 아닌 다수의 관점과 출처를 확인할 수 있으며, 편향된 정보에 의존하지 않는 탐색 환경을 경험할 수 있다. 또한 GPU 집약형 생성AI 대비 전력 소비량이 훨씬 낮아 지속 가능성 측면에서도 효율적이다.

인시아드 필 파커(Phil Parker) 경영과학 석좌교수는 “보티피디아는 데이터와 출처에 기반해 다각적인 관점을 제공한다.”라고 말했다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지