깊은 추론과 에이전트 코딩을 결합한 차세대 멀티모달 AI 개발 인프라

지식 노동자들은 매일 쏟아지는 정보를 마주하지만, 논문·영상·코드·이메일처럼 제각각인 자료를 한 번에 이해하고 정리해 주는 도구는 여전히 마땅치 않다. 긴 문서를 읽고 요약하고, 그 내용을 바탕으로 코드를 작성하고, 관련 일정을 잡는 일까지 모두 사람이 나눠서 처리하다 보니, 개발자든 연구자든 학생이든 직장인이든 아이디어는 많은데 실제로 만들어 내기까지 어렵다고 느끼기 쉽다. 이 복잡한 흐름을 대신 설계하고 실행까지 할 수 있는 에이전트형 AI에 대한 기대가 커지는 이유가 여기에 있다.

구글(Google)이 멀티모달 이해·추론 능력을 강화한 ‘제미나이 3(Gemini 3)’를 공개했다고 19일 밝혔다.

분위기를 읽는 최상위 추론형 에이전트

제미나이 1은 네이티브 멀티모달(Native Multimodal) 구조와 긴 컨텍스트 윈도우(long context window)로 텍스트와 이미지를 넘어 다양한 정보를 한 번에 처리하는 토대를 마련했다. 이어 제미나이 2는 에이전트 기능의 기반을 다지고 복잡한 사고와 추론 능력의 범위를 넓혔다.

제미나이 3는 창의적인 아이디어 속 미묘한 단서를 포착하고, 복잡한 문제를 여러 층위로 나눠 분석하는 등 깊이와 뉘앙스를 이해하는 추론 능력을 갖췄다. 또한 요청의 컨텍스트와 의도를 더욱 정확히 파악해 최소한의 프롬프트만으로도 원하는 결과에 도달한다. 

‘제미나이 3 프로(Gemini 3 Pro)’는 프리뷰(preview) 버전으로 우선 공개되며, 제미나이 앱, AI 스튜디오(AI Studio), 버텍스 AI(Vertex AI) 개발자 툴, 그리고 새로운 에이전트 개발 플랫폼 구글 안티그래비티(Google Antigravity)에 적용된다. 동시에 강화된 추론 모드 ‘제미나이 3 딥 씽크(Gemini 3 Deep Think)’도 공개해 구글 AI 울트라(Google AI Ultra) 구독자 제공 전에 안전성 테스터 대상 평가를 진행한다.

구글 검색 내 제미나이 3(자료제공=구글)
구글 검색 내 제미나이 3(자료제공=구글)

사고의 파트너로 설계된 응답 스타일

제미나이 3 프로는 더 높은 수준의 깊이와 뉘앙스를 구현한다. 답변은 똑똑하고 간결하며 직설적인 톤을 추구하고, 상투적인 문구나 과도한 아첨을 줄인다. 이용자가 듣고 싶어 하는 말이 아니라 실제로 도움이 되는 조언과 통찰을 제공하는 사고의 파트너(thought partner)를 지향한다.

이 모델은 복잡한 과학 개념을 고해상도 시각화 코드로 바꿔주거나, 토카막 내 플라즈마 흐름을 시각화하는 코드와 함께 핵융합 물리학을 담은 시를 만드는 등, 이해와 표현 방식을 동시에 확장하는 예시를 제시한다.

무엇이든 배우게 하는 멀티모달 러닝 파트너

제미나이 3는 설계 초기부터 텍스트, 이미지, 비디오, 오디오, 코드 등 여러 양식을 넘나들며 정보를 종합하도록 만들어졌다. 최첨단 추론 능력, 시각·공간 이해, 뛰어난 다국어 성능, 최대 100만 토큰 컨텍스트 윈도우를 결합해 이용자가 가장 편한 방식으로 학습을 이어갈 수 있다.

예를 들어 여러 언어와 손글씨가 섞인 집안 레시피를 해독·번역해 공유 가능한 가족 요리책으로 정리해 주거나, 학술 논문과 긴 동영상 강의, 튜토리얼을 입력하면 내용을 이해하는 데 도움이 되는 상호작용형 가이드를 코드로 만들어 준다. 또 피클볼 경기 영상을 분석해 자세 개선점을 짚고, 전반적인 훈련 계획까지 제안하는 식으로 현실 세계의 영상과 피드백을 연결한다.

구글 검색의 AI 모드(AI Mode in Search)는 제미나이 3를 활용해 웹 정보를 더 잘 이해하고, RNA 중합효소 작동 원리 같은 복잡한 주제도 몰입형 시각 레이아웃, 대화형 도구, 시뮬레이션이 결합된 ‘생성형 UI(generative UI)’로 설명한다. 이를 통해 사용자는 텍스트 위주의 요약을 넘어, 시각적이고 상호작용적인 방식으로 개념을 익힐 수 있다.

바이브 코딩과 에이전트 코딩으로 무엇이든 만들기

제미나이 3는 제미나이 2.5 프로가 보여준 개발자 생산성 향상을 한 단계 더 확장한다. 제로 샷(zero-shot) 생성 능력이 강해 복잡한 프롬프트와 지침을 처리하면서도 풍부하고 상호작용이 뛰어난 웹 UI를 생성해 낸다. ‘바이브 코딩(vibe coding)’과 에이전트 코딩 영역에서 가장 높은 성능을 목표로 설계됐다는 점도 특징이다.

이를 바탕으로 이용자는 구글 AI 스튜디오, 버텍스 AI, 제미나이 CLI, 구글 안티그래비티에서 제미나이 3를 활용해 개발을 수행할 수 있다. 서드 파티 환경에서도 커서(Cursor), 깃허브(GitHub), 젯브레인스(JetBrains), 마누스(Manus), 레플릿(Replit) 같은 플랫폼에서 제미나이 3 기반 개발 경험을 제공한다.

예시로 구글은 제미나이 3를 통해 레트로 3D 우주선 게임, 정교한 3D 복셀(voxel) 아트, 셰이더(shader) 기반 SF 게임 월드, 보다 인터랙티브한 웹 UI와 앱을 손쉽게 생성하는 시나리오를 제시하며, 모델이 개발자와 크리에이터의 실험 공간을 넓힌다고 설명한다.

에이전트 우선 개발 플랫폼

제미나이 3를 기반으로 구글은 개발 경험 자체를 재정의하는 에이전트 우선(agent-first) 플랫폼 구글 안티그래비티를 선보인다. 이 플랫폼은 제미나이 3의 추론 능력, 툴 활용, 에이전트 코딩을 결합해 과업 중심(task-oriented)으로 일할 수 있는 환경을 제공한다.

인터페이스는 익숙한 AI IDE 형태지만, 내부의 에이전트는 독립된 작업 공간을 가지고 편집기, 터미널, 브라우저에 직접 접근해 코드 검증과 엔드투엔드 소프트웨어 작업을 스스로 계획·실행할 수 있다.

또한 브라우저 제어에 특화된 제미나이 2.5 컴퓨터 유즈(Computer Use) 모델과 이미지 편집 모델인 나노 바나나(Nano Banana, 제미나이 2.5 이미지)와 결합돼 있다. 이를 통해 예를 들어 항공편 추적 앱을 위한 에이전틱 워크플로를 구성하고, 브라우저 기반 컴퓨터를 활용해 앱을 계획·코딩·검증하는 시연이 가능하다.

장기 계획과 일상 업무까지 확장된 에이전트

제미나이 2로 에이전트 시대를 연 이후, 구글은 코딩 에이전트뿐 아니라 장기 계획과 이행 능력을 지속적으로 개선해 왔다. 제미나이 3는 가상의 자판기 비즈니스를 장기간 운영하는 시나리오를 평가하는 벤팅-벤치(Vending-Bench) 2에서 리더보드 1위를 차지하며 이를 수치로 보여준다.

이 벤치마크에서 제미나이 3는 1년에 해당하는 시뮬레이션 기간 동안 일관된 툴 사용과 의사 결정을 유지하며, 작업에서 이탈하지 않고 더 높은 수익을 올리는 모습을 보였다. 이는 제미나이 3가 실제 환경에서 메일함 정리, 예약 처리, 복잡한 다단계 워크플로 실행 등 일상 업무를 처음부터 끝까지 보다 안정적으로 처리하는 데 활용될 수 있음을 시사한다.

제미나이 3 벤치마크 비교(자료제공=구글)
제미나이 3 벤치마크 비교(자료제공=구글)

구글 AI 울트라 구독자는 제미나이 앱 내 제미나이 에이전트(Gemini Agent)를 통해 이러한 에이전트 기능을 경험할 수 있다. 예시로 제미나이 에이전트는 지메일 받은 편지함을 분석해 메일을 정리하고, 이용자의 가이드를 바탕으로 필요한 후속 조치를 제안하는 시나리오가 소개된다. 향후 구글은 이 기능을 더 많은 제품으로 확장할 계획이다.

안전성과 책임 있는 제미나이 3 구축

제미나이 3는 과도한 긍정 반응(sycophancy)을 줄이고, 프롬프트 주입(prompt injection)에 대한 저항력을 강화했으며, 사이버 공격에 대한 방어 능력을 높이는 방향으로 튜닝됐다.

평가는 구글의 프런티어 안전 프레임워크(Frontier Safety Framework)가 규정한 핵심 영역을 기준으로 내부 테스트와 외부 전문가 협업을 병행해 진행됐다. 구글은 영국 AI 안전 연구소(UK AI Security Institute)에 조기 접근 권한을 제공하고, 전문 기관으로부터 독립적인 검증도 받았다.

제미나이 3는 구글 전반에 걸쳐 단계적으로 적용된다. 제미나이 앱 이용자는 순차적으로 제미나이 3 기반 기능을 경험하게 되며, 검색의 AI 모드는 미국 내 구글 AI 프로·울트라 구독자를 대상으로 제미나이 3를 적용한 형태로 제공된다.

개발자는 구글 AI 스튜디오의 제미나이 API, 구글 안티그래비티, 제미나이 CLI를 통해 제미나이 3에 접근할 수 있고, 버텍스 AI와 제미나이 엔터프라이즈(Gemini Enterprise)를 이용하는 기업 고객도 해당 모델을 활용할 수 있다. 제미나이 3 딥 씽크는 몇 주 내 구글 AI 울트라 구독자에게 제공되기 전에, 안전 테스터를 대상으로 한 평가 과정을 먼저 거친다.

구글은 제미나이 3 시리즈 내 추가 모델도 순차적으로 선보일 계획이다. 이용자와 개발자의 피드백을 바탕으로 지능, 에이전트, 개인화의 한계를 계속 확장할 방침이다.

관련기사

저작권자 © 지티티코리아 무단전재 및 재배포 금지