# 구글, Gemini 3.5 Flash 정식 출시…'플래시 퍼스트'로 에이전트 시대 기본값을 바꾸다

![Image](https://upload.cafenono.com/image/slashpagePost/20260527/114705_rbADFB1wWcicpA6XE8?q=80&s=1280x180&t=outside&f=webp)

구글이 지난 5월 19일 연례 개발자 행사 구글 I/O에서 Gemini 3.5 Flash를 정식 출시하고, 출시 당일 곧바로 Gemini 앱과 검색의 AI Mode 기본 모델로 채택했다. 프리뷰 버전이던 gemini-3-flash-preview를 즉시 대체하면서, 전 세계 Gemini 앱 사용자 9억 명과 AI Mode 사용자 10억 명이 별도 설정 없이 새 모델을 쓰게 됐다. 핵심은 단순한 모델 교체가 아니라, 대형 플래그십이 아닌 빠르고 저렴한 모델을 에이전트 시대의 주력으로 세우겠다는 전략 선언이라는 점이다.

성능 지표가 이 결정의 근거다. 구글이 공개한 벤치마크 기준으로 Gemini 3.5 Flash는 터미널 작업 능력을 보는 Terminal-Bench 2.1에서 76.2%, 에이전트 도구 활용을 평가하는 MCP Atlas에서 83.6%, 종합 추론 지표 GDPval-AA에서 1656 Elo를 기록했다. 코딩과 에이전트 작업에서 상위 모델인 Gemini 3.1 Pro를 앞질렀다는 것이 구글의 설명이다. 토큰 생성 속도는 '다른 프런티어 모델 대비 4배 빠르다'고 밝혔고, 컨텍스트 윈도는 105만 토큰에 이른다.

비용 경쟁력은 더 공격적이다. 가격은 입력 100만 토큰당 1.5달러, 출력 100만 토큰당 9달러이며 캐시된 입력은 100만 토큰당 0.15달러까지 떨어진다. 입력 10만 토큰과 출력 2만 토큰을 기준으로 한 작업당 실효 비용은 0.33달러 수준으로, 구글은 이를 두고 앤트로픽 Opus 4.7(작업당 약 1달러)의 3분의 1, GPT-5.5의 절반가량이라고 비교했다. '다른 프런티어 모델의 절반 이하 비용'이라는 표현을 공식적으로 내걸었다.

주목할 대목은 출시 순서를 뒤집었다는 점이다. 그동안 구글은 상위 Pro 모델을 먼저 내놓고 경량 Flash를 효율 등급으로 뒤따르게 하는 'Pro 퍼스트' 방식을 써왔다. 이번에는 Flash를 먼저 정식 출시했고, 상위 모델인 Gemini 3.5 Pro는 6월로 미뤘다. 순다르 피차이 CEO는 Pro에 대해 '다음 달에 출시하겠다'고만 언급했다. 작고 빠른 모델을 보조가 아니라 기본 아키텍처로 세우겠다는 의도가 출시 순서 자체에 담긴 셈이다.

이 전환이 시사하는 바는 분명하다. AI 경쟁의 무게중심이 '가장 똑똑한 한 번의 응답'에서 '수많은 호출을 빠르고 싸게 반복하는 에이전트 워크로드'로 옮겨가고 있다는 신호다. 에이전트는 한 작업을 처리하는 데 모델을 수십 번씩 호출하기 때문에, 속도와 단가가 곧 실용성을 좌우한다. 구글이 10억 명 규모의 사용자 기반에 가장 먼저 꽂은 카드가 플래그십이 아니라 Flash라는 사실은, 앞으로 모델 경쟁이 '최고 성능'만큼이나 '대규모로 감당 가능한 비용과 속도'로 판가름날 것임을 보여준다. 다만 인용된 벤치마크는 모두 구글이 자체 공개한 수치인 만큼, 독립 검증 결과가 나오기 전까지는 어느 정도 거리를 두고 받아들일 필요가 있다.

한편 경쟁 구도 측면에서 이번 출시는 앤트로픽과 오픈AI를 직접 겨냥한 가격표라는 해석이 나온다. 비용을 명시적으로 Opus 4.7, GPT-5.5와 나란히 비교하며 '절반 이하'를 강조한 것은, 성능 우위 주장과 별개로 기업 도입 단계에서 단가 민감도가 높아진 시장을 노린 포석으로 읽힌다.

[Digital Applied](https://www.digitalapplied.com/blog/ai-model-releases-may-2026-complete-tracker)

[AI Model Releases May 2026: Complete Launch Tracker](https://www.digitalapplied.com/blog/ai-model-releases-may-2026-complete-tracker)

For the site tree, see the [root Markdown](https://blog.teamjcurve.com/.md).