新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

前端鋪開智能體,后端猛砸TPU:直擊谷歌I/O大會

2026-05-20 15:17
光錐智能
關注

圖片

泄洪式更新,谷歌如何布局芯片、模型和智能體?

文|魏琳華

編|王一粟

曾經號稱“看不懂AI”的伯克希爾,開始加倉AI。

谷歌,就成了Q1伯克希爾大量加持的其中一家AI公司。一季度,伯克希爾增持谷歌母公司Alphabet的A類股3640萬股,環比激增約204%,持倉市值增至156億美元。

投資公司們的熱錢開始翻倍投入谷歌的同時,谷歌也用真實數據展示了一件事——當AI真正開始為普通人所用時,它的增長曲線能飛得多漂亮。

“兩年前,我們每月處理的總計9.7 萬億個Tokens,去年在I/O大會上,這一數字已增長至約480 萬億;如今,這一數字更是激增了7倍,達到每月3200萬億的水平。”在北京時間5月20日凌晨1點開啟的谷歌I/O大會上,谷歌CEO桑達爾·皮查伊說。

緊接著,他放出了一組組翻倍的用戶數量和Token消耗數據:谷歌的模型API現在每分鐘處理大約190億個Tokens,環比上季度增長6倍;Gemini App月活超過9億,同比去年4億翻了一倍,用戶每日請求總量則翻了7倍。

圖片

Token消耗量一日千里的情況下,谷歌開始用密集的新品轟炸,抓住當前最能撐起Tokens生意的產品——智能體。

本屆I/O大會上,谷歌的信念是“萬物皆可智能體”:

要個人助手,有7×24在線、對標龍蝦的云端智能體Gemini Spark;要Vibe Coding,有支持多個Agent同時運行的Antigravity 2.0版本;要搜索體驗,有能幫用戶準確查找信息的多個智能體協同;Gemini App更是針對用戶需求在各個維度增設了各類Agent。

用模型當技術底氣,用應用帶動Tokens消耗翻倍的同時,谷歌對AI基礎設施的投入也隨之翻倍。

去年,谷歌云在AI基礎設施上投入了超過300億美元。皮查伊在大會上表示,今年這一數字將是去年的六倍左右,大約為1800億至1900億美元。

砸錢做基建,是為了每月都在翻倍的消耗做準備,但谷歌的野心不局限在谷歌云。據外媒報道,谷歌和黑石集團將共同創建一家新AI云公司,以谷歌的TPU芯片為核心,這可能代表著谷歌正在挑戰英偉達等芯片公司的地位。

作為少有布局芯片-模型-產品的公司,谷歌在本屆I/O大會上已經鋪開了一張巨大的地圖。

視頻模型、文本模型雙發布 打問號的性價比

本屆I/O大會上,模型和智能體成為了最有看點的發布內容。

一向喜歡在I/O大會先展示AI模型的谷歌,今年也不例外,拿出了兩款模型——多模態模型Gemini Omni Flash(下簡稱Omni)和又快又便宜的Gemini 3.5 Flash。

作為單開新系列的模型,Omni支持從任何輸入創建任何內容,它現在支持用戶輸入文本、圖片、文件、視頻給到模型,目前只支持輸出視頻,后續會擴展到文本、音頻等內容形態。

通過同時訓練不同形態的數據,Omni在物理規律的理解上表現有所提升。光錐智能測試讓Gemini Omni Flash生成一個“臺球白球擊打紅球入袋”的視頻,相比上一代Veo的表現,Omni對力學的理解確實有進步,白球在擊飛紅球后實現了緩慢靜止的要求,改掉了Veo版本擊打后仍然亂飛的效果。

Omni也吸取了圖片編輯模型Nano Banana的爆火思路,被訓練成一個支持靠文本描述修改的視頻編輯模型,F場展示中,谷歌展示了“讓雕塑變成泡泡”、“根據圖片上畫出的動線,讓魚順方向游動”等案例。

前幾天被曝光的Gemini 3.5 Flash模型,也如預料般成為了I/O大會的展示主力。

谷歌眼中的新模型,主打一個“又快又便宜”,在模型部分性能(如Agentic能力、多模態等)超越Gemini 3.1 Pro的同時,有點給各類智能體打基礎的意思。

圖片

在每秒Token輸出速度上,Gemini 3.5 Flash比海外部分前沿模型快4倍,測試效果非常直觀,讓它寫個簡單游戲代碼幾乎是“噴”出來一般的快。皮查伊現場還表示,搭載上自家的編程產品Antigravity,整體速度能快12倍。

圖片

誠然,從絕對性能角度來說,Flash模型沒辦法跟其它家最新旗艦模型打擂臺,但用谷歌的話說,它的成本是前沿模型的一半。

這里我們以Claude Sonnet 4.6為例,以其每百萬Token輸入3美元、輸出15美元的價格對比,后者每百萬輸入為1.5美元(50%)、輸出9美元(66.7%)的價格優勢顯著。

皮查伊當場算了筆賬,表示許多公司年度Token預算超過1萬億,若將負載遷移到Gemini 3.5 Flash,每年可省10億美元。

雖然谷歌對自己的新模型大加贊賞,但對于關注谷歌Flash系列定價的用戶來說,Gemini 3.5 Flash再好,它的價格定位也超出了Flash系列的“便宜”預期。

比起前一代Gemini 3 Flash每百萬Token輸入0.5美元、輸出3美元的定價相比,新的Flash模型相當于定價直接翻了三倍。何況現在據AA排行榜上顯示,Gemini 3.5 Flash的綜合分數低于Gemini 3.1 Pro,從上面的跑分也能看到,其實在HLM(人類最后測試,反映模型處理復雜任務能力)部分指標上表現不如后者,這讓新模型處在一個“比起旗艦不香、比定價又翻倍”的尷尬境地。

為了測試它和Gemini 3.1 Pro到底誰編程更香,光錐智能做了個測試,讓兩個模型分別做個簡單的魔塔小游戲出來,兩版代碼都在運行的時候出現了地圖部分線路堵死導致無法游玩的問題。但要求它們修改的時候,Gemini 3.1 Pro直接修復了地圖路線規劃問題,但Flash版本對話修改失敗。谷歌給出的“性能全面超越”,可能需要打個問號。

圖片

除了對模型能力的優化,谷歌也試圖通過可視化進一步提升用戶體驗。比如我們在測試Gemini 3.5 Flash的時候,Gemini會選擇性把一部分對話用AI編程的方式,做可視化的效果呈現。不過在測試中,等了超過5分鐘也沒等到最終效果生成,等待時間拉長,體驗感反倒降低了。

至于新款旗艦模型到底表現如何,答案還要在下個月Gemini 3.5 Pro的發布上見分曉。

全線上新智能體 谷歌的AI訂閱生意

“我們已經進入了新的智能體時代。”谷歌產品經理的一句開場白后,本屆I/O大會的絕對主角——智能體占據了大多數時間的展示。

比起只發布Flash版本給大伙嘗鮮的兩個模型,谷歌的重頭戲還是放在了智能體上。一場大會里,基本每個介紹單元都有Agent的出現。這些產品的底層模型,也正是上文發布的Gemini Flash 3.5。

說實話,在Claude有Cowork,國內也紛紛跟進智能體的情況下,Google來得不算早。但坐擁一系列產品,如何把智能體放進各個產品中,谷歌確實也需要更多時間考慮這個問題。

最直接對標龍蝦的Agent是Gemini Spark,這是一個運行在谷歌云上的云端智能體。

可以說,谷歌做這種面向大眾消費者的思路也一樣謹慎,在安全的前提上做嘗試。比如在聯動谷歌產品時,默認關閉狀態,用戶可以選擇手動開啟。

Spark目前看下來,它的殺手锏是與 Gmail、日歷、驅動器、文檔、表格、幻燈片、YouTube 、地圖等谷歌產品無縫打通,通過自家龐大的應用生態,做到能夠接近龍蝦式的高權限優勢。

在谷歌的現場展示中,Spark能幫忙起草電子郵件、抓取表格信息并整理到文檔中、根據抓取的內容做好日程提醒,可以說樁樁件件都和谷歌生態強相關。上述功能演示看起來比較簡單和初級,也印證了谷歌本身還在智能體賽道試水的情況。谷歌還表示,前期先打通內部能力,后幾周將會更新MCP加入第三方功能聯動。

圖片

不過,目前我們還無法直接體驗到Spark產品。谷歌披露,本周開始,Gemini Spark將面向少數用戶開放,后續將面向Google AI Ultra用戶和部分企業用戶開放。它即將出現在郵件、Gemini App中,今年夏天還可能出現在瀏覽器里。

放在谷歌王牌的AI搜索轉型上,智能體能力的加入,也成了AI搜索優化的看點。

它支持開啟多個智能體幫助用戶搜索信息,比如做一個特定金融領域收集股票信息的Agent、讓AI幫你做租房信息更新的實時追蹤。這個服務將在今年夏天向AI Pro和Ultra訂閱用戶開放。

智能體編程能力也被整合進了AI搜索。

用戶可以直接借助搜索結果構建可視化效果。比如,在用戶搜索一些復雜名詞時,AI能夠直接做出可視化的動畫,相當于直接做了個動畫版本的演示,讓用戶不僅能通過文字了解,更能上手體驗。這是一項免費服務,預計今年夏天對用戶開放。

在購物方面,谷歌引入的智能體更多是作為體驗優化和支付生態標準。

以Universal Cart(通用購物車)為例,它不僅能提供價格比較和優惠信息,還能進行跨平臺比價、給出用戶購物建議。一個讓筆者印象深刻的例子是,當用戶想要組裝一臺電腦時,購物車功能可以主動發現硬件兼容性問題——比如CPU與主板不匹配、電源功率不足,從而給用戶提供購物指導。

在Gemini產品的優化中,一些特定功能的智能體成了拉升用戶體驗的附贈品。

比如幫你整理每日訊息、待辦事項的Daily Brief;Google Flow中的多模態創作智能體則支持同時進行多個創作任務,比如針對一張圖片同時生成16個不同角度的拍攝效果視頻。

圖片

大張旗鼓做智能體,谷歌想在C端靠智能體能力的加入,豐富付費服務的同時,讓更多用戶選擇為智能體買單。

會議上,谷歌宣布為AI訂閱的Ultra檔服務開放一個每月100美元的新檔,上述介紹的智能體能力就能夠在這個更低定價的服務中開放。此外,谷歌的AI編程產品Antigravity也迎來升級,開放多智能體任務的同時,也將打通到AI Ultra的訂閱中。

圖片

在OpenAI最近宣布把最高檔訂閱價格砍半、由每月200美元降低至100美元后,谷歌的動作也來了。在大會上,谷歌也宣布,將每月250美元的訂閱價格降低50美元。

谷歌的智能體轟炸和定價調整,放在C端來看,都是在為競爭加劇的訂閱生意做準備。

AI基建投入翻6倍 谷歌AI生態閉環

兩款模型發布、一系列智能體的更新好比繁花,而它們扎根的土壤——AI基建,雖然只是被簡單提及,但它正在成為谷歌講通物理AI故事、拉升公司市值的關鍵業務。

谷歌對AI基建的投入狂熱,從真金白銀上直接體現出來。比去年翻了6倍、高達180億美元以上的投入,雖然谷歌有錢,但這對它來說依然是一筆不小的投入。

圖片

“我們一直在為現在和未來投資。”皮查伊說。

兩款之前已經在谷歌云大會上發布的第八代芯片8t和8i,分別對應大模型的訓練和推理,前者讓每單元的計算性能提升3倍,通過全球100萬+分散各地的芯片共同調用,它們讓谷歌的模型訓練速度“從幾天變為幾周”,后者則提升了模型的推理速度——在現場展示中,Gemini的Flash模型每秒鐘輸出Token速度提升到了接近1500個左右。

圖片

利好自家的同時,谷歌的TPU也正在成為硅谷各家AI大廠爭相囤貨的對象之一。

先是今年2月,Meta叫停自家自研芯片業務的同時,展開與AMD、谷歌合作,據The Information報道,Meta和谷歌達成一項關于租賃TPU的數十億美元交易,同時Meta在洽談明年購買TPU業務;Anthropic也和谷歌、博通簽署長期協議,承諾在未來五年內采購約5吉瓦的TPU算力用于模型訓練。

搭建起龐大的芯片銷售業務之外,借助TPU,谷歌的AI云業務還在進一步拓展。

5月,黑石集團也被曝與谷歌達成合作,向一家合資企業投資50億美元,其中黑石提供50億美元,谷歌提供包括TPU專用芯片在內的軟硬件服務,新公司計劃在2027年實現500兆瓦算力。

至此,谷歌的芯片-云服務-模型-產品生態已經愈發完整,隨著AI帶動Token消耗量指數級增長,每一層業務的提升,都能讓谷歌在AI領域再拿出一筆漂亮的營收。

       原文標題 : 前端鋪開智能體,后端猛砸TPU:直擊谷歌I/O大會

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號