首枚自研芯片發布背后, 是Open AI的全棧野心？

2026-07-02 13:37

超前實驗室

關注

作者｜青蘋吹果

編輯｜無心插柳柳橙汁

Open AI的第一枚自研芯片造出來了。

前不久，Open AI在社交平臺上曬出了一張圖，畫面里Sam Altman從博通CEO陳福陽手里接過了一片晶圓。

不是PPT，也不是概念圖，是一顆已經在實驗室里跑通了真實模型的工程樣片。

它的名字叫Jalapeño，是Open AI從頭設計的第一顆AI推理芯片，專治AI推理太貴、太慢、太耗電。

九個月前，它還只是一張白紙。而九個月后，它已經能在實驗室里穩穩跑通GPT-5.3-Codex-Spark這樣的模型，頻率和功耗全部達標。

更離譜的是，幫它加速設計的，就是Open AI自己家的模型。

自己養的AI，幫自己造了副新“身體”？

不僅如此，這副新身體，還要用來跑更聰明的下一代AI，你用的ChatGPT、Codex，正在反過來幫它們自己打造下一代要跑的硬件。

我有種預感，這個飛輪一旦轉起來，很多東西要被重寫。

首枚自研芯片發布背后, 是Open AI的全棧野心？

九個月，行業紀錄被碾碎

經常造芯片的朋友們都知道，一顆高性能ASIC（專用集成電路），從定架構到交給工廠流片，常規周期是兩到三年。

Google第一代TPU從架構到流片花了大約三年，傳統芯片公司同等規模的項目動輒五到七年。

Open AI只用了九個月。

這速度，堪比芯片界的“特種兵極限越野”，被稱之為“高性能先進半導體領域有史以來最快的ASIC開發周期”。這還真不是吹牛。

怎么做到的？兩個原因，一個靠“腦力”，一個靠“體力”。

第一，AI幫自己畫電路圖，把驗證的死循環跑成了“快進模式”。

芯片設計最折磨人的環節不是設計架構，而是設計完之后成千上萬次驗證、修改、再驗證的死循環。這部分在項目周期里往往要占掉大半時間。

而AI恰好擅長干這種“暴力枚舉”的臟活累活。

Open AI沒有披露具體細節，但明確提到，他們用自家模型加速了設計和優化的部分流程。

這畫面就有點科幻了，AI幫自己畫電路圖，電路圖變成芯片，芯片跑出更強的AI，更強的AI再去畫下一代芯片。

形成了一個自己給自己“遞扳手”的閉環，速度能不快嗎？

實驗室里的工程樣片已經在跑了，跑的是GPT5.3CodexSpark這類前沿模型，頻率和功耗全部達到量產目標。

第二，挖來了專業團隊，讓最懂敲代碼的人，反過來教芯片怎么跑代碼。

Open AI硬件團隊的掌門人Richard Ho，曾在谷歌做了九年TPU芯片工程，最高做到高級工程總監。

他那段時間參與發明的機器學習輔助芯片設計方法，讓多個TPU項目第一次流片就成功了。之后他又去光子計算公司Lightmatter待過，幾乎把“AI硬件”這條路上每個關鍵節點都踩了一遍。

2023年底他加入Open AI，迅速拉起了一支約40人的精銳部隊。

一個懂LLM運行規律的人，帶著一幫懂LLM運行規律的模型，去設計專門跑LLM的硬件，完全就是對癥下藥！

但有個問題：流片成功，就等于量產無憂嗎？

當然不是。

流片只是把設計送去制造，距離大規模量產還有良率、供應鏈、軟件生態一堆坎要邁。

但九個月能把一張白紙變成一塊能跑的硅片，這個節奏本身已經夠讓人咂舌了。

首枚自研芯片發布背后, 是Open AI的全棧野心？

為什么不碰“訓練”，專攻“推理”？

Jalapeño有個很明確的定位：只做推理，不搞訓練。

訓練和推理，對芯片的要求完全是兩碼事。

訓練，是教模型“讀書認字”的階段。你得把全網的公開資料、書籍、代碼一股腦塞給它，讓它從海量數據里自己摸索出規律。

這個過程需要極其恐怖的算力密度，以及海量的高帶寬內存來喂數據，而且對通用計算能力要求極高。

在這個領域，英偉達的GPU憑借CUDA生態和硬件架構，筑起了一道幾乎無法逾越的護城河，短期內誰也撬不動。

推理就不一樣了，推理是模型“答題”的階段。

你打開ChatGPT敲下一行字，點擊發送，服務器那頭在幾秒鐘之內生成回答并傳回給你，這就是推理。

推理任務的特點是：模型已經定型了，不需要再學新東西，只需要在既定框架下快速、低成本地處理海量用戶請求。

這種工作，最適合用專用芯片來做精準優化，把每一瓦電、每一分錢都榨出最大價值。

Open AI選擇從推理側下場造芯，是一個相當務實的決策。

為什么這么說？因為很多人沒意識到，推理正在悄悄取代訓練，成為算力消耗的頭號大戶。

行業里的主流模型，推理端消耗的算力已經逐漸超過了訓練端。

訓練模型像蓋一棟大樓，圖紙畫完、主體封頂，錢一次性花出去了，后面就不用再掏了。但推理呢？大樓蓋好之后，每天開門營業，空調、電梯、照明、維護，每一秒都在往外掏錢，只要還有用戶在問ChatGPT，這錢就停不下來。

換句話說講，訓練是“首付”，推理是“月供”，月供可是要還一輩子的。

對于ChatGPT這種用戶量以億為單位的產品來說，推理成本如果一直居高不下，盈利就永遠是一筆算不過來的賬。

用戶越多，回答問題越勤快，算力賬單就越滾越大，收入還沒捂熱就被成本吃掉了。

Jalapeño就是沖著這個死穴來的。

博通CEO陳福陽透露，跟市面上主流的AI圖形處理單元相比，Jalapeño能把推理成本砍掉接近一半。

原來處理一次請求花兩毛，現在一毛出頭就夠了。省下來的全是利潤空間。

不止成本，性能方面的消息也很炸。

早期測試顯示，Jalape?o的每瓦性能“大幅優于當前業界最先進水平”。陳福陽在接受路透社采訪時甚至放話說，這顆芯片的表現足以和英偉達Blackwell、Google TPU掰手腕。

不過，目前這些數字都是官方自己說的，還沒有第三方獨立實驗室跑過基準測試。

官方喊“媲美Blackwell”，具體是在什么模型上測的、什么并發條件下跑的、跟Blackwell的哪個配置比的，這些細節都得等技術報告正式發布才能見分曉。

但這不妨礙我們先興奮一下。

首枚自研芯片發布背后, 是Open AI的全棧野心？

Open AI的“全棧”野心，不只是造顆芯片

Jalapeño意為墨西哥辣椒，屬于辣度最溫和的品種。

起這個名字，其實也是Open AI在暗示：Jalapeño只是第一步，以后面還有更“辣”的。

首枚自研芯片發布背后, 是Open AI的全棧野心？

以前Open AI的活法很簡單：只管專心搞模型，至于算力和數據中心，全丟給微軟和英偉達去頭疼。

這讓他們在早期的模型軍備競賽里跑得飛快，但也埋下一個結構性隱患——算力成本的定價權，不攥在自己手里。

命門在別人手上，交租得看房東臉色。

而Open AI今天面對的競爭環境，已經和兩三年前完全不同了。

在過去，模型能力是最大的競爭變量，只要能把模型做得更聰明，算力貴一點還能忍。但進入Agent、AI編程、AI視頻等新階段后，模型能力正在逐漸趨同，真正拉開差距的，開始變成誰能以更低的成本、更大的規模，把智能戰力持續送到用戶手里。

換句話說，AI競爭正在從“誰模型最好”轉向“誰交付智能的效率最高”。而推理芯片，恰恰就是決定這種效率的底層基礎設施。

2025年秋天之后，Open AI的動作明顯變了節奏。

首枚自研芯片發布背后, 是Open AI的全棧野心？

先是和博通宣布合作搞自研加速器，緊接著跟英偉達簽了千億美元級別的數據中心協議，又和AMD鎖定了6GW的芯片供應，2026年6月還跟Cerebras談下了750MW的推理算力訂單。

加上這次Jalape?o芯片正式亮相，四條路線齊頭并進：

自研芯片、英偉達、AMD、Cerebras。

現在看，你還會覺得Open AI是一家單純“做模型的公司”嗎？

顯然不會了。

從更長遠來看，自研芯片的意義，甚至不只是節省成本。

AI行業正在進入一個新的競爭階段：模型、芯片、網絡、數據中心、軟件棧開始越來越緊密地耦合在一起。未來真正領先的AI公司，比拼的可能不再只是某一個模型，而是整套基礎設施是否能夠協同優化。

就像蘋果通過自研M系列芯片，把硬件、操作系統和應用生態整合成一個整體一樣，Open AI也正在嘗試把模型、推理系統和底層硬件一起設計。這意味著，它希望優化的不只是某一個模型，而是整個AI服務鏈路。

而且Open AI的IPO籌備正在路上。在這個節點上推出自研芯片，就是在非常明確的向投資市場傳遞信號：這家公司有辦法、有計劃把推理成本這個最大的出血點給堵上。

財務敘事和技術敘事在此匯合。

合作模式上，Open AI選了一條務實路線。

芯片架構、內核優化、服務系統由自己主導；硅實現和網絡互聯交給博通（谷歌TPU就是通過博通量產的，這條路已經跑通過）；板卡、機架和系統集成則交給了加拿大的Celestica，順帶一提，這家公司同樣是谷歌TPU的首選制造伙伴。

三家拼起了一張完整的拼圖。

博通CEO陳福陽把這次合作稱為“一項根本性承諾”，不是一次性項目，而是一個多代際路線圖的起點。

Jalape?o只是開始，根據此前媒體報道，第二代芯片的代號叫“Serrano”，同樣是一種辣椒。

部署時間線也定了，2026年底開始初步部署，之后逐年擴展，最終目標是和微軟等合作伙伴一起，建設吉瓦（GW）級別的數據中心。

吉瓦是什么概念？

大約相當于整個北京市的居民用電量。這種量級的電力調度，本身就是一種基礎設施建設能力的終極壓力測試。

Open AI正在從一家AI實驗室，蛻變成一家全棧AI公司。

模型自己訓，芯片自己設計，推理自己優化，部署自己控制。

首枚自研芯片發布背后, 是Open AI的全棧野心？

你的ChatGPT賬單，正在被重寫

說了這么多，這些跟我們普通人有什么關系？

關系大了，以后我們用的AI將會越來越“物美價廉”。

Greg Brockman在發布時說過：“世界正在轉向一個由算力驅動的經濟。”

首枚自研芯片發布背后, 是Open AI的全棧野心？

這話聽著大，但細想不虛。

無論是學生想借助AI理解一篇論文，還是小企業用API搭建一個客服系統，又或者獨立開發者靠代碼助手完成一個項目，背后都是算力在悄悄做功。

而算力成本的高低，直接決定了這些東西是少數人的工具，還是多數人的日常。

Open AI把Jalape?o定位在推理側，本質上是在做一件事：讓智能變得更便宜、更快、更穩定。

每次推理延遲少一秒，每個API調用價格降一分，落到每一個普通人那里，就是能用更少的錢，更順暢地使用AI，甚至用上那些今天還只屬于大企業和付費用戶的高級能力。

打個比方，你以前每月花錢訂閱，請回來的就是個能陪你侃大山的“高級AI陪聊”。但到了明年，同樣的價錢，你請回來的可能是個能幫你把整份PPT做完、順便把Excel表也清理了的“全能實習生”。

價格沒變，但“打工人”的段位飆升了好幾級，加量不加價。

當然，不只是花錢的用戶。當算力變得跟水電一樣便宜，曾經只有大廠才燒得起“最強大腦”，以后可能就變成每個人隨手就能用的標配工具。

首枚自研芯片發布背后, 是Open AI的全棧野心？

寫在最后

回過頭來看整件事，最妙的其實是這個循環：

AI設計芯片 → 芯片跑AI → 更強的AI設計下一代芯片。

更好的基礎設施→更高的算力效率→更好的訓練和服務→更強的模型→更好的產品→更多用戶和收入→再投入下一代基礎設施。

這個飛輪一旦轉起來，就是自我加速的。

Google有TPU，Amazon有Trainium，Meta有MTIA，微軟有Maia。OpenAI現在也有Jalape?o了。

這個飛輪一旦轉起來，就是自我加速的。

Google有TPU，Amazon有Trainium，Meta有MTIA，微軟有Maia。OpenAI現在也有Jalape?o了。

大模型公司造芯片，正在從“要不要”變成“能不能”的問題。

當然，從流片到大規模量產，中間還有良率、供應鏈、軟件生態等一系列問題要解決。

要知道，英偉達那個CUDA平臺，就像是AI界的“通用語言”或“水電網絡”，大家用了十幾年，早就習慣成自然了。現在你想讓所有人換套新系統？那難度不亞于讓全國司機一夜之間改靠左行駛。

再看看前面的老大哥：谷歌的TPU打磨了十年才有今天，亞馬遜的Inferentia也是踩了無數個坑、迭代了好幾輪才敢大規模鋪開。

Open AI想憑一顆“辣椒”就一步登天？路還長著呢。

但Jalape?o的出世至少證明了一件事：AI不僅能幫人干活，還能幫自己造“身體” 。

用最懂LLM的模型，設計最跑LLM的硬件，一旦這個循環跑起來，那個“算力更便宜、AI更普及”的未來，將會加速到來。

首枚自研芯片發布背后, 是Open AI的全棧野心？

原文標題 : 首枚自研芯片發布背后，是Open AI的全棧野心？

本地收藏打印推薦給朋友

聲明： 本文由入駐維科號的作者撰寫，觀點僅代表作者本人，不代表OFweek立場。如有侵權或其他問題，請聯系舉報。

發表評論

共0條評論，0人參與

立即登錄即可訪問所有OFweek服務

忘記密碼

其他方式

請輸入評論內容...

請輸入評論/評論長度6~500個字

暫無評論

圖片新聞

新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

發表評論

登錄