# 구글 딥마인드, 200만 토큰 멀티모달 맥락창 갖춘 'Gemini 3.1 Ultra' 공개… GPT-5.5에 정면 도전장

![Image](https://upload.cafenono.com/image/slashpagePost/20260505/154802_gLe6OyTl7YbZ9gXxFM?q=80&s=1280x180&t=outside&f=webp)

구글 딥마인드가 5일(현지시간) 차세대 플래그십 모델 'Gemini 3.1 Ultra'를 공개하며 오픈AI가 지난달 출시한 GPT-5.5에 대한 정면 반격에 나섰다. 새 모델은 텍스트·이미지·오디오·영상을 별도 변환 단계 없이 한 번의 추론 사이클에서 동시에 처리하는 진정한 의미의 네이티브 멀티모달 아키텍처를 채택했으며, 200만 토큰에 달하는 컨텍스트 윈도우와 대화 도중 코드를 작성·실행·검증할 수 있는 내장 샌드박스 도구를 함께 탑재했다.

200만 토큰은 장편 소설 약 15권 분량 또는 두 시간짜리 고화질 영상 전체를 한꺼번에 입력해 분석할 수 있는 규모다. 구글은 데모를 통해 100여 개 PDF로 구성된 기업 실사 자료, 회의 녹화 영상, 재무 스프레드시트를 동시에 투입해 단일 보고서를 생성하는 시연을 선보였다. 특히 모델 내부에 격리된 코드 실행 환경을 두어, 사용자가 데이터 분석을 요청하면 직접 파이썬 코드를 작성·실행한 뒤 결과를 검증해 다시 답변에 반영하는 '에이전틱 워크플로'를 단일 인터페이스에서 구현한 점이 주목된다.

이번 공개는 지난 4월 오픈AI가 GPT-5.5를 출시하며 추론 성능과 에이전트 능력을 한 단계 끌어올린 직후 이뤄졌다. 구글은 그간 '딥 리서치(Deep Research)'와 '딥 리서치 맥스' 등 자율 연구 에이전트를 잇따라 내놓으며 추격 의지를 드러내왔으며, 이번 Ultra 모델은 그 기반 인프라를 단일 패키지로 통합한 결과물이다. 모델 컨텍스트 프로토콜(MCP)을 통해 팩트셋·S&P 글로벌·피치북 등 외부 데이터 소스에도 직접 접근할 수 있어, 기업용 워크로드에서 경쟁력을 확보하겠다는 전략이 분명히 읽힌다.

업계는 Gemini 3.1 Ultra의 등장으로 'AI 모델 3강 구도(오픈AI·구글·앤트로픽)'의 격차가 다시 좁혀질 것으로 보고 있다. 특히 200만 토큰이라는 압도적 맥락창은 법률·의료·금융 등 대용량 문서를 다루는 전문 영역에서 RAG(검색증강생성) 의존도를 낮출 수 있다는 평가다. 다만 추론 비용과 응답 지연 시간이 실사용 환경에서 어떻게 통제될지가 관건으로, 구글은 차등 가격제와 '플래시' 계열 경량화 모델을 함께 운영해 비용 우려를 상쇄하겠다는 입장이다.

Gemini 3.1 Ultra는 우선 Gemini API의 Interactions API를 통해 퍼블릭 프리뷰로 제공되며, 향후 수 주 내 Vertex AI와 워크스페이스 전 제품군으로 확대 적용될 예정이다. 개발자 생태계 입장에서는 GPT-5.5와 동등 이상의 추론 능력에 더 긴 맥락창과 네이티브 멀티모달이라는 차별점이 더해지면서, 어떤 모델 위에 다음 세대의 에이전트 제품을 올릴지 재선택의 시점이 도래한 셈이다. 향후 수개월간 벤치마크 검증과 실제 기업 도입 사례가 시장의 균형을 가를 분수령이 될 전망이다.

[Google Blog](https://blog.google/innovation-and-ai/models-and-research/gemini-models/next-generation-gemini-deep-research/)

[Deep Research Max: a step change for autonomous research agents](https://blog.google/innovation-and-ai/models-and-research/gemini-models/next-generation-gemini-deep-research/)

For the site tree, see the [root Markdown](https://blog.teamjcurve.com/.md).