Gemini 3 Flash：為速度而生的前沿智能

2025-12-18 17:21

來源： OFweek人工智能網

今日，Google 發(fā)布了 Gemini 3 Flash，以極低的成本提供速度極快的尖端智能。

上個月，Google 推出了 Gemini 3，包括 Gemini 3 Pro 和 Gemini 3 Deep Think 模式。

Gemini 3 Flash 將 Gemini 3 的專業(yè)級推理能力與 Flash 級別的延遲、效率和成本優(yōu)勢相結合，是 Google 迄今為止在智能體工作流程方面最出色的模型。

從今天起，Gemini 3 Flash 將向用戶推出：

適用于 Google AI Studio、Gemini CLI 和新的智能體開發(fā)平臺 Google Antigravity 中的 Gemini API 開發(fā)者
所有用戶均可通過 Gemini 應用和 AI 模式在搜索中使用。
適用于 Vertex AI 和 Gemini Enterprise 的企業(yè)

大規(guī)模前沿智能

Gemini 3 Flash 證明，速度和規(guī)模無需以犧牲智能為代價。它在博士級別的推理和知識基準測試中，例如 GPQA Diamond (90.4%) 和 Humanity's Last Exam (33.7%)，均展現出前沿性能，足以媲美規(guī)模更大的前沿模型，并且在多項基準測試中顯著超越了目前最佳的 2.5 版本模型 Gemini 2.5 Pro。

此外，它在 MMMU Pro 測試中也取得了 81.2% 的成績，與 Gemini 3 Pro 的性能相當。

除了前沿的推理能力和多模態(tài)處理能力外，Gemini 3 Flash 的設計目標是極高的效率，突破質量、成本和速度之間的帕累托極限。

在最高思維水平下進行處理時，Gemini 3 Flash 能夠靈活調整其思考時間。對于更復雜的應用場景，它可能需要更長的思考時間，但根據典型流量的測試結果，它平均使用的 tokens 數量比 2.5 Pro 少 30%，從而以更高的性能更準確地完成日常任務。

Gemini 3 Flash 性能超越 2.5 Pro，速度提升 3 倍（基于 Artificial Analysis 基準測試），而價格卻低得多。Gemini 3 Flash 的定價為每百萬個輸入 token 0.50 美元，每百萬個輸出 token 3 美元。

與時俱進的智能

Gemini 3 Flash 專為迭代開發(fā)而設計，它擁有 Gemini 3 專業(yè)級的編碼性能，同時延遲極低。

在用于評估編碼代理能力的基準測試 SWE-bench Verified 中，Gemini 3 Flash 的得分高達 78%，不僅超越了 2.5 系列，甚至超越了 Gemini 3 Pro。

Gemini 3 Flash 在推理、工具使用和多模態(tài)功能方面的強大性能，非常適合希望進行更復雜的視頻分析、數據提取和視覺問答的開發(fā)人員，這意味著它可以實現更智能的應用——例如游戲助手或 A/B 測試實驗——這些應用既需要快速的答案，也需要深入的推理。

像 JetBrains、Bridgewater Associates 和 Figma 這樣的公司已經開始使用它來轉型業(yè)務。JetBrains 首席 AI 生態(tài)工具開發(fā)員 Denis Shiryaev 表示，在限制額度的生產設置中，Gemini 3 Flash 始終遵循用戶額度預算，讓復雜多步驟的 AI Agent 保持快速、可預測、規(guī)模化的性能。

基于 Gemini 3 Pro 的推理能力，Gemini 3 Flash 的 AI 模式能夠更有效地解析問題的細微差別，并有效地將研究與即時行動相結合。

Gemini 3 Flash 現已通過 Google AI Studio、 Google Antigravity、 Vertex AI 和 Gemini Enterprise 中的 Gemini API 提供預覽版。用戶還可以通過其他開發(fā)者工具，例如 Gemini CLI 和 Android Studio，訪問。

參考資料：

https://blog.google/products/gemini/gemini-3-flash/