AI 기반 이미지 생성 및 해석 기술이 급속히 발전하면서, 기업들은 이미지와 텍스트를 함께 활용하는 멀티모달 AI 시스템을 적극 도입하고 있다. GPT-4o, 클로드 오퍼스 및 구글 제미나이 출시 이후, 기업들은 고객 가치를 창출하기 위해 이미지 생성에 막대한 투자를 해왔다. 그러나 이러한 AI 경험이 확장됨에 따라 LLM 시스템의 예측 불가능성 또한 증가한다.
이러한 시스템이 생성하는 정보의 정확성과 신뢰성을 보장하는 것은 여전히 중요한 과제로 남아 있다. 특히 AI 모델이 존재하지 않는 정보를 생성하는 ‘AI 환각’ 현상이 문제로 대두되고 있으며, 이에 대한 효과적인 검증 도구의 필요성이 커지고 있다.
글로벌 AI 개발, 벤치마킹 및 최적화 기업 패트로너스 AI(Patronus AI, CEO 아난드 칸나판)가 이미지-텍스트 애플리케이션을 위한 멀티모달 AI 시스템을 평가하고 최적화할 수 있는 평가 서비스 ‘멀티모달 LLM 심판(MLLM-as-a-Judge)’을 출시했다.
이 서비스는 제미나이를 기반으로 AI 엔지니어가 텍스트 존재 여부, 격자 구조, 공간 방향 및 객체 식별을 검사한다. 사용자는 멀티모달 AI 애플리케이션의 품질을 반복적으로 측정하고 개선할 수 있다.

특히 ▲캡션 환각 감지 (표준 및 엄격) ▲기본 및 비기본 객체 설명 검증 ▲객체 위치 정확도 ▲이미지 캡션 정확성 검증 ▲표 형식 데이터에 대한 OCR 추출 정확도, AI 생성 브랜드 자산 정확도 및 장면 설명 유효성 테스트 등을 지원한다.
한편, 패트로너스 AI는 제미나이를 선정한 이유를 오픈AI의 GPT-4V와 같은 대안보다 더 신뢰할 수 있는 MLLM 심판 역할을 수행할 수 있으며, 자기 중심성이 낮고 판단에 더 공정한 접근 방식을 보이는 것으로 나타난 것을 들었다. 특히, 자체 내부 평가 데이터셋에서 제미나이의 백본이 다른 멀티모달 LLM에 비해 더 나은 성능을 보였다고 전했다.
현재 사용중인 예로, 독립 판매자용 마켓플레이스 에트시(Etsy)는 이미 패트로너스 AI의 MLLM 기반 심판을 구현해 제품 이미지의 캡션 환각을 감지 및 완화하고 있다. 또한 패트로너스AI 플랫폼을 활용해 멀티모달 AI 시스템을 최적화하고 있다.
패트로너스 AI는 향후 오디오 및 비전 기능을 포함하도록 멀티모달 평가 기능을 확장할 계획이다.
패트로너스 AI CEO 아난드 칸나판(Anand Kannappan)은 "우리의 사명은 항상 AI의 확장 가능한 감독을 발전시키는 것이었다."라며, "우리의 MLLM 기반 심판은 멀티모달 시스템에 대한 투명하고 신뢰할 수 있는 평가를 제공함으로써 이러한 중요한 과제를 해결한다"라고 말했다.
관련기사
- 데이터브릭스-팔란티어, AI 모델 최적화·데이터 거버넌스 강화 협력
- 알리바바 클라우드, 폴라DB로 TPC-C 벤치마크 세계 기록 달성
- 스노우플레이크-마이크로소프트, 코텍스 AI에서 오픈AI 최신 모델 제공
- 방대한 3D 콘텐츠 관리, AI 멀티모달 검색과 필터링으로 해결
- 세일즈포스-구글 클라우드, AI 에이전트에 멀티모달 기능 도입
- 바이두, 성능·경제성 높은 ‘멀티모달·추론 AI 모델’과 무료 AI 챗봇 공개
- 정확도·생산성 높이는 ‘시각적 AI 개발 워크플로’...데이터 품질 개선·모델 분석 간소화로 대규모 AI 구축 가속
- 바이오테크 개발 지원 P2P 솔루션...‘CRO 검색·실시간 분석·AI 자동화’ 구현
- ‘실시간 AI 평가 엔진’으로 ‘데이터 주권 보존·규정 준수’ 걱정 無
- ‘RAG 평가 오픈소스 프레임워크’...AI 에이전트 정확성·신뢰성·설명가능성 보장
- 한국딥러닝, VLM 기반 OCR 솔루션 출시...수억 원의 초기 비용, '제로'로 낮춘다
- ‘NSFW AI 이미지 생성기’, 간단한 텍스트로 고품질 개인화 이미지가 뚝딱!
- 히타치 밴타라-해머스페이스, 데이터 인텔리전트 AI 인프라 솔루션 협력 강화
- 실시간 시각 추론 및 다국어 음성 인터페이스 탑재 ‘멀티모달 AI 솔루션’
- 기업들이 주목하는 AI 환각·편향 제거 ‘머신 언러닝’ 기술
- 대규모 하이브리드 데이터 기반 보상 모델, 기업 AI 활용도 극대화
- 인간 수준 사회적 인지 갖춘 AI, 의료·마케팅·보안 혁신 이끈다
