就在昨日,xAI 又推出 Grok 4 Fast。馬斯克在自己的 X 平臺上配文:2M 上下文窗口!除了支持 2M 的上下文窗口之外,新模型僅需 約1/10 的價格即可達到 Gemini 2.5 的性能,可謂是性價比之王了。
xAI 官方表示,這是他們在經濟高效的推理模型方面的最新進展。Grok 4 Fast 吸取了 Grok 4 的經驗教訓,在企業和消費者領域提供前沿級別的性能,并具有卓越的 token 效率。
該模型突破了更小、更快的 AI 界限,使更多用戶和開發者能夠獲得高質量的推理。Grok 4 Fast 具有最先進的 (SOTA) 經濟高效性、尖端的 Web 和 X 搜索功能、2M token 上下文窗口,以及將 reasoning 和 non-reasoning 模式融合在一個模型中的統一架構。
提升成本效益
Grok 4 Fast 在成本效益智能方面開辟了新領域,在推理基準測試中表現優于 Grok 3 Mini,同時大幅降低了代幣成本。
團隊利用大規模強化學習來最大化 Grok 4 Fast 的智能密度。在評估中,Grok 4 Fast 在基準測試中實現了與 Grok 4 相當的性能,同時平均使用的思考 token 數量減少了 40%。
Grok 4 Fast 的代幣效率提高了 40%,再加上每個代幣的價格大幅降低,導致價格降低了98%,但在前沿基準上卻實現了與 Grok 4 相同的性能。經人工智能分析的獨立審查驗證,與人工智能指數上其他公開可用的模型相比,Grok 4 Fast 展現出了最先進的 (SOTA) 價格與智力比。
強化學習提高搜索能力
Grok 4 Fast 采用工具使用強化學習 (RL) 進行端到端訓練。它擅長判斷何時調用代碼執行或網頁瀏覽等工具。
例如,Grok 4 Fast 展現了前沿的代理搜索能力,能夠無縫瀏覽網頁和 X,并使用實時數據增強查詢。它能夠快速跳轉鏈接,提取媒體(包括 X 上的圖片和視頻),并以光速整合搜索結果。
評分擊敗 Open AI、Gemini 2.5
在 LMArena 的搜索評估中, grok-4-fast-search 以 1163 的成績奪得冠軍 ,領先 o3-search 17 分。其卓越的推理效率和智能密度使其在現實世界的搜索相關任務中超越規模更大的模型。
在 LMArena 的 Text Arena 中, grok-4-fast 排名第 8 ,性能與 grok-4-0709 相當,凸顯了其卓越的智能密度。值得注意的是,它的表現顯著優于同重量級的同類模型,所有同等大小的模型都排在第 18 位或更靠后。
以下是 Grok 4 Fast 的一些實際示例:
統一模型:長鏈思維和快速響應
Grok 4 Fast 引入了統一的架構,其中 reasoning (長鏈思維)和 non-reasoning (快速響應)由相同的模型權重處理,并通過系統提示進行控制。這種統一降低了端到端延遲和 token 成本,使 Grok 4 Fast 成為實時應用的理想選擇。
目前,Grok 4 Fast已面向所有用戶開放,Auto 模式下的復雜查詢將自動調用 Grok 4 Fast,可無限次使用。
團隊還預計推出 Grok 4 Fast 的兩個模型: grok-4-fast-reasoning 和 grok-4-fast-non-reasoning ,每個模型都包含一個 2M 的令牌上下文窗口。定價如下: