據資深科技記者 Alex Heath 爆料,Google 計劃在Google I/O 年度開發者大會(5 月 20 日)推出新一代輕量化模型 Gemini 3.2 Flash。這款模型被視為 Google 的「刺客產品」,傳出其推理成本僅為 OpenAI GPT-5.5 的二十分之一,但核心性能卻能達到對方的九成以上。
Flash 級別、旗艦戰鬥力
根據 Abacus.AI 執行長 Bindu Reddy 透露的技術細節,Gemini 3.2 Flash 在編碼(Coding)與推理(Reasoning)任務上的表現極其驚人,已達到 GPT-5.5 水準的 92%。最令業界關注的是其極致的成本優化與低延遲表現。
據稱,新模型的推理成本僅為 GPT-5.5 的 1/15 至 1/20,且大多數查詢的延遲被壓低在 200 毫秒以內。透過「模型蒸餾(Distillation)」與「稀疏化(Sparsification)」技術,Google 成功將前沿旗艦模型的能力壓縮進 Flash 等級,且未出現輕量模型常見的性能崩潰。
五月初早有徵兆
事實上,Gemini 3.2 Flash 的出現並非無跡可尋。今年 5 月初,開發者便在 iOS 應用構建包與 AI Studio 的元數據中發現了該模型的痕跡。
隨後,該模型疑似以匿名身份出現在 LM Arena 評測中,引發測試者熱議。早期反饋指出,該模型在「創意編碼」任務中表現尤為突出,甚至在部分基準測試中超越了現有的旗艦級模型 Gemini 3.1 Pro。
對標 GPT-5.5,僅次於 Anthropic Mythos
報導指出,Google 此次的策略非常明確:Gemini 3.2 Flash 的整體性能將與 GPT-5.5 處於同等級別,雖然在絕對實力上仍略遜於 Anthropic 目前的巔峰之作 Mythos,但在「性價比」與「響應速度」上,Gemini 3.2 Flash 幾乎沒有對手。
這意味著對於需要處理海量數據、即時客服或複雜 Agent 自動化工作流的企業用戶來說,這款新模型將極具吸引力。