전 세계 기업들이 생성AI를 비즈니스 핵심에 통합하면서, AI 출력 결과의 정확성과 신뢰성 확보가 필수 과제로 부상하고 있다. 특히 헬스케어, 금융 등 규제 산업에서는 단일 오류도 심각한 결과를 초래할 수 있어, 환각 현상과 모호성을 줄이고 사실 기반 응답을 보장하는 검증 기술의 수요가 급격히 증가하고 있다.

아마존웹서비스(Amazon Web Services, 이하 AWS)가 아마존 베드록 가드레일(Amazon Bedrock Guardrails) 내 환각 현상과 모호성을 최소화해 모델이 생성한 응답의 정확성을 최대 99%까지 수학적으로 검증할 수 있는 ‘자동 추론 검사(Automated Reasoning checks)’ 서비스를 정식 출시한다고 8일 밝혔다.

형식 검증 기반의 수학적 정확성 확보

자동 추론 검사는 최대 8만 토큰, 약 100페이지 분량의 문서를 한 번에 처리할 수 있어 방대한 정책 문서도 다룰 수 있다. 또한 사용자가 생성한 검증 테스트를 저장하고 반복 실행할 수 있어 시간이 지나도 정책 유지 및 점검이 용이하다.

사용자 정의 기반으로 테스트 시나리오도 자동 생성해 시간과 노력을 절약하면서 더 많은 경우의 수를 테스트할 수 있으며 자연어 기반의 정책 개선 제안을 통해 정책 품질을 손쉽게 향상할 수 있다. 마지막으로 특정 요구 사항에 맞게 신뢰도 점수 임계치를 조정해, 검사 강도를 제어할 수 있다.

통계적 샘플링이나 인간의 검토에 의존하는 기존 접근법과 달리, 자동 추론 검사는 형식 검증(formal verification) 기법을 활용한다. 이는 10여 년간 AWS 클라우드 인프라를 보호해 온 것과 동일한 수학적 방법으로, 정의된 비즈니스 규칙과 도메인 지식에 따라 AI 출력 결과가 적합한지 검증한다.

복잡한 규칙 검증과 정책 변화 대응

AWS는 AI 시스템에서 올바른 추론을 작동시키는 데 가장 어려운 과제로 규정한 세 가지 문제를 자동 추론 검사 개발을 통해 해결했다. 

첫째, 자연어에서 구조화된 언어로의 번역 정확도를 향상했다. 자동 추론 검사는 자연어와 논리적 술어 간의 변환을 위해 여러 접근 방식을 사용하며, 이후 형식 논리 해결기(formal logic solvers)를 활용해 다양한 해석 간의 동치성(equivalence)을 증명하거나 반증한다.

둘째, 규칙 해석의 합의 도출과 변화 대응의 메커니즘을 제공한다. 조직은 종종 미묘한 모순을 포함하고 있는 규칙들의 의미에 대한 합의를 도출하는데 어려움을 겪는다. 또한, 규칙은 지속적으로 변화한다. 자동 추론 검사는 고객이 각자의 도메인 내에서 사실을 정의할 수 있는 프레임워크를 제공하며, 규칙이 변화함에 따라 이러한 정의를 지속적으로 정교화할 수 있는 메커니즘을 제공한다.

셋째, 표면적으로 작아 보이는 규칙의 집합이라도 검증해야 하는 경우의 수는 천문학적으로 증가할 수 있다. 자동 추론 검사는 이러한 조합적 검증 작업을 여러 가지 경우에서 매우 빠르게 수행할 수 있도록 고도화된 도구를 활용한다.

규제 산업 적용

특히 자동 추론 검사는 헬스케어, 금융 서비스, 유틸리티와 같은 규제 산업의 엔터프라이즈 AI 도입을 지원한다. 프라이스 워터하우스 쿠퍼스(PwC)와 같은 AWS 파트너들은 이 기술을 의약품 콘텐츠 검토, 유틸리티 운영, 헬스케어 커뮤니케이션, 보험 청구 처리 등 다양한 산업 분야에서 실제 시나리오에 적용하고 있다.

예를 들어, 의료 서비스 제공자가 생성AI를 활용해 환자와 소통하는 경우, 자동 추론 검사는 각 응답이 환자에게 전달되기 전에 의료 가이드라인과 일치하는지 여부를 검증할 수 있다.

자동 추론 검사는 현재 미국 동부(버지니아 북부, 오하이오), 미국 서부(오리건), 유럽(프랑크푸르트, 아일랜드, 파리) 등 여러 AWS 리전에서 제공된다. 아마존 베드록 콘솔과 파이썬용 AWS SDK(AWS SDK for Python)을 통해 이용할 수 있다.

이 서비스는 에이전트형 AI 워크플로와 통합되며, 각 행동이 실행되기 전에 이를 검증하고, 포괄적인 감사 추적을 유지한다. 이는 인간의 지속적인 감독 없이 결정을 내리는 자율 시스템에 필수적인 기능이다.

AI 시스템이 더욱 자율화되고 비즈니스 운영에 깊이 통합됨에 따라, 통계적 신뢰보다는 수학적 확실성을 제공하는 도구들이 책임감 있는 AI 배포의 필수 구성 요소가 될 것이다. AWS는 자동 추론 검사를 통해 생성AI의 역량과 형식 검증의 엄밀함을 결합한 AI 검증의 새로운 기준을 제시하고 있다.

AWS 바이런 쿡(Byron Cook) 부사장 겸 특임 과학자는 “언어, 문법, 의미, 타당성, 건전성, 완전성, 계산 복잡성, 심지어 결정 불가능성과 같은 문제들은 이전에는 너무 학문적이고 모호해서 대중과는 거리가 멀었다. 하지만 이제 모든 것이 바뀌었다.”라고 말했다.

 

[알림] GTT KOREA GTT SHOW는 오는 8월 12일 오후 2시부터 3시까지 “피해 큰 BPF Door 같은 커널 기반 악성코드 막는 EDR과 마이크로세그멘테이션 실전 보안 전략”을 주제로 웨비나를 진행합니다. BPF Door 같은 커널 기반의 악성코드가 사용하는 공격 기법과 침투 단계별 위협의 소개, EDR과 마이크로세그멘테이션이 어떻게 상호보완적으로 작동하여 침입 초기 탐지부터 내부 확산 차단까지 이어지는 보안 체계의 구축 전략과 새로운 형태의 변종 공격에 유연하게 대응하는 제로 트러스트 기반 보안 전략을 실전 사례와 함께 제시합니다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지