
오늘 새벽 Google I/O 2026에서 Gemini 3.5 Flash를 공개했습니다.
더불어 Gemini 3.1 때는 [flash, thinking, pro] 로 명명되어있던 이름들도 [flash-lite, flash, pro] 로 명명을 정리하였습니다.
모델 카드는 Gemini 3.5 Pro는 공개하지 않은 상태이며, Gemini 3.5 Flash만 공개하였습니다.

따라서 Opus 4.7이나 GPT-5.5와 직접적인 비교는 하기 어렵겠지만, 흥미로운 것은 Gemini 3.5 Flash가 Agentic benchmark나 Finance Agent, MMMU-Pro 와 같이 multi-modal agent로 작동하기 위해 필요한 벤치마크에서 특출나게 좋은 성능을 냈다는 것입니다.
Gemini가 원래 가지고 있던 장점은 token 값이 비슷한 성능 모델들에 비해서 월등히 싸다는 것이었는데 (input $0.5/1M, output ...

flash 속도나 성능 측면에서는 확실히 개선된게 보이는데 토큰 가격이 너무 비싸져서 커뮤니티 반응은 좀 복합적인 듯 합니다;; 원래 가성비 느낌으로 사용하는 사람들이 많았는데

아마 개인 api 보다는 agent 등에 써야하거나, enterprise 등에서는 좀 더 가격에 대해 tolerable할거라 생각하는 것 같습니다. 그런 곳에서 수익이 더 많이 나고 날거라 생각하는 것 같고요.

개인적으로 속도보단 성능이 중요하다는 입장인데 모르겠네요 ㅠㅠ 어짜피 성능이 좋으면 일을 병렬로 하면 되니깐요...

상당히 호불호가 갈릴만한 선택을 했다는 생각입니다. 구글이 agent에 대한 수요를 잘 예측한거면 대성공일거고, 아니면 꽤 큰 판단미스가 될수도 있겠네요. 유저입장에서는 좀 아쉽지만 ㅎㅎ