今日,Google 發(fā)布了 Gemini 3 Flash,以 極低的成本提供速度極快的尖端智能 。
上個月,Google 推出了 Gemini 3,包括 Gemini 3 Pro 和 Gemini 3 Deep Think 模式。
Gemini 3 Flash 將 Gemini 3 的專業(yè)級推理能力與 Flash 級別的延遲、效率和成本優(yōu)勢相結合,是 Google 迄今為止在智能體工作流程方面最出色的模型。
從今天起,Gemini 3 Flash 將向用戶推出:
適用于 Google AI Studio、Gemini CLI 和新的智能體開發(fā)平臺 Google Antigravity 中的 Gemini API 開發(fā)者
所有用戶均可通過 Gemini 應用和 AI 模式在搜索中使用。
適用于 Vertex AI 和 Gemini Enterprise 的企業(yè)
大規(guī)模前沿智能
Gemini 3 Flash 證明,速度和規(guī)模無需以犧牲智能為代價。它在博士級別的推理和知識基準測試中,例如 GPQA Diamond (90.4%) 和 Humanity's Last Exam (33.7%),均展現出前沿性能,足以媲美規(guī)模更大的前沿模型,并且在多項基準測試中顯著超越了目前最佳的 2.5 版本模型 Gemini 2.5 Pro。
此外,它在 MMMU Pro 測試中也取得了 81.2% 的成績,與 Gemini 3 Pro 的性能相當。
除了前沿的推理能力和多模態(tài)處理能力外,Gemini 3 Flash 的設計目標是 極高的效率,突破質量、成本和速度之間的帕累托極限 。
在最高思維水平下進行處理時,Gemini 3 Flash 能夠靈活調整其思考時間。對于更復雜的應用場景,它可能需要更長的思考時間,但根據典型流量的測試結果,它平均使用的 tokens 數量 比 2.5 Pro 少 30%, 從而以更高的性能更準確地完成日常任務。
Gemini 3 Flash 性能超越 2.5 Pro,速度 提升 3 倍 (基于 Artificial Analysis 基準測試),而價格卻低得多。Gemini 3 Flash 的定價為 每百萬個輸入 token 0.50 美元 ,每百萬個輸出 token 3 美元 。
與時俱進的智能
Gemini 3 Flash 專為迭代開發(fā)而設計,它擁有 Gemini 3 專業(yè)級的編碼性能,同時 延遲極低 。
在用于評估編碼代理能力的基準測試 SWE-bench Verified 中,Gemini 3 Flash 的得分高達 78%, 不僅超越了 2.5 系列,甚至超越了 Gemini 3 Pro。
Gemini 3 Flash 在推理、工具使用和多模態(tài)功能方面的強大性能,非常適合希望進行 更復雜的視頻分析、數據提取和視覺問答的開發(fā)人員 ,這意味著它可以實現更智能的應用——例如游戲助手或 A/B 測試實驗——這些應用既需要快速的答案,也需要深入的推理。
像 JetBrains、Bridgewater Associates 和 Figma 這樣的公司已經開始使用它來轉型業(yè)務。JetBrains 首席 AI 生態(tài)工具開發(fā)員 Denis Shiryaev 表示,在限制額度的生產設置中,Gemini 3 Flash 始終遵循用戶額度預算,讓復雜多步驟的 AI Agent 保持快速、可預測、規(guī)模化的性能。
基于 Gemini 3 Pro 的推理能力,Gemini 3 Flash 的 AI 模式能夠更有效地解析問題的細微差別,并有效地將研究與即時行動相結合。
Gemini 3 Flash 現已通過 Google AI Studio、 Google Antigravity、 Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供預覽版。用戶還可以通過其他開發(fā)者工具,例如 Gemini CLI 和 Android Studio,訪問。
參考資料:
https://blog.google/products/gemini/gemini-3-flash/