新在线不卡免费视频|www国产精品久久麻豆|美女午夜福利网站|《福克斯号上空姐们》|关于秘书的电影|美少女的哀羞txt|日产国产一区二区三区

訂閱
糾錯
加入自媒體

首枚自研芯片發布背后, 是Open AI的全棧野心?

2026-07-02 13:37
超前實驗室
關注

首枚自研芯片發布背后, 是Open AI的全棧野心?首枚自研芯片發布背后, 是Open AI的全棧野心?

作者|青蘋吹果

編輯|無心插柳柳橙汁

Open AI的第一枚自研芯片造出來了。

前不久,Open AI在社交平臺上曬出了一張圖,畫面里Sam Altman從博通CEO陳福陽手里接過了一片晶圓。

不是PPT,也不是概念圖,是一顆已經在實驗室里跑通了真實模型的工程樣片。

它的名字叫Jalapeño,是Open AI從頭設計的第一顆AI推理芯片,專治AI推理太貴、太慢、太耗電。

九個月前,它還只是一張白紙。而九個月后,它已經能在實驗室里穩穩跑通GPT-5.3-Codex-Spark這樣的模型,頻率和功耗全部達標。

更離譜的是,幫它加速設計的,就是Open AI自己家的模型。

自己養的AI,幫自己造了副新“身體”?

不僅如此,這副新身體,還要用來跑更聰明的下一代AI,你用的ChatGPT、Codex,正在反過來幫它們自己打造下一代要跑的硬件。

我有種預感,這個飛輪一旦轉起來,很多東西要被重寫。

首枚自研芯片發布背后, 是Open AI的全棧野心?

九個月,行業紀錄被碾碎

經常造芯片的朋友們都知道,一顆高性能ASIC(專用集成電路),從定架構到交給工廠流片,常規周期是兩到三年。

Google第一代TPU從架構到流片花了大約三年,傳統芯片公司同等規模的項目動輒五到七年。

Open AI只用了九個月。

這速度,堪比芯片界的“特種兵極限越野”,被稱之為“高性能先進半導體領域有史以來最快的ASIC開發周期”。這還真不是吹牛。

怎么做到的?兩個原因,一個靠“腦力”,一個靠“體力”。

第一,AI幫自己畫電路圖,把驗證的死循環跑成了“快進模式”。 

芯片設計最折磨人的環節不是設計架構,而是設計完之后成千上萬次驗證、修改、再驗證的死循環。這部分在項目周期里往往要占掉大半時間。

而AI恰好擅長干這種“暴力枚舉”的臟活累活。

Open AI沒有披露具體細節,但明確提到,他們用自家模型加速了設計和優化的部分流程。

這畫面就有點科幻了,AI幫自己畫電路圖,電路圖變成芯片,芯片跑出更強的AI,更強的AI再去畫下一代芯片。

形成了一個自己給自己“遞扳手”的閉環,速度能不快嗎?

實驗室里的工程樣片已經在跑了,跑的是GPT5.3CodexSpark這類前沿模型,頻率和功耗全部達到量產目標。

第二,挖來了專業團隊,讓最懂敲代碼的人,反過來教芯片怎么跑代碼。

Open AI硬件團隊的掌門人Richard Ho,曾在谷歌做了九年TPU芯片工程,最高做到高級工程總監。

他那段時間參與發明的機器學習輔助芯片設計方法,讓多個TPU項目第一次流片就成功了。之后他又去光子計算公司Lightmatter待過,幾乎把“AI硬件”這條路上每個關鍵節點都踩了一遍。

2023年底他加入Open AI,迅速拉起了一支約40人的精銳部隊。

一個懂LLM運行規律的人,帶著一幫懂LLM運行規律的模型,去設計專門跑LLM的硬件,完全就是對癥下藥!

但有個問題:流片成功,就等于量產無憂嗎? 

當然不是。

流片只是把設計送去制造,距離大規模量產還有良率、供應鏈、軟件生態一堆坎要邁。

但九個月能把一張白紙變成一塊能跑的硅片,這個節奏本身已經夠讓人咂舌了。

首枚自研芯片發布背后, 是Open AI的全棧野心?

為什么不碰“訓練”,專攻“推理”?

Jalapeño有個很明確的定位:只做推理,不搞訓練。

訓練和推理,對芯片的要求完全是兩碼事。

訓練,是教模型“讀書認字”的階段。你得把全網的公開資料、書籍、代碼一股腦塞給它,讓它從海量數據里自己摸索出規律。

這個過程需要極其恐怖的算力密度,以及海量的高帶寬內存來喂數據,而且對通用計算能力要求極高。

在這個領域,英偉達的GPU憑借CUDA生態和硬件架構,筑起了一道幾乎無法逾越的護城河,短期內誰也撬不動。

推理就不一樣了,推理是模型“答題”的階段。

你打開ChatGPT敲下一行字,點擊發送,服務器那頭在幾秒鐘之內生成回答并傳回給你,這就是推理。

推理任務的特點是:模型已經定型了,不需要再學新東西,只需要在既定框架下快速、低成本地處理海量用戶請求。

這種工作,最適合用專用芯片來做精準優化,把每一瓦電、每一分錢都榨出最大價值。

Open AI選擇從推理側下場造芯,是一個相當務實的決策。

為什么這么說?因為很多人沒意識到,推理正在悄悄取代訓練,成為算力消耗的頭號大戶。

行業里的主流模型,推理端消耗的算力已經逐漸超過了訓練端。

訓練模型像蓋一棟大樓,圖紙畫完、主體封頂,錢一次性花出去了,后面就不用再掏了。但推理呢?大樓蓋好之后,每天開門營業,空調、電梯、照明、維護,每一秒都在往外掏錢,只要還有用戶在問ChatGPT,這錢就停不下來。

換句話說講,訓練是“首付”,推理是“月供”,月供可是要還一輩子的。

對于ChatGPT這種用戶量以億為單位的產品來說,推理成本如果一直居高不下,盈利就永遠是一筆算不過來的賬。

用戶越多,回答問題越勤快,算力賬單就越滾越大,收入還沒捂熱就被成本吃掉了。

Jalapeño就是沖著這個死穴來的。

博通CEO陳福陽透露,跟市面上主流的AI圖形處理單元相比,Jalapeño能把推理成本砍掉接近一半。

原來處理一次請求花兩毛,現在一毛出頭就夠了。省下來的全是利潤空間。

不止成本,性能方面的消息也很炸。

早期測試顯示,Jalape?o的每瓦性能“大幅優于當前業界最先進水平”。陳福陽在接受路透社采訪時甚至放話說,這顆芯片的表現足以和英偉達Blackwell、Google TPU掰手腕。

不過,目前這些數字都是官方自己說的,還沒有第三方獨立實驗室跑過基準測試。

官方喊“媲美Blackwell”,具體是在什么模型上測的、什么并發條件下跑的、跟Blackwell的哪個配置比的,這些細節都得等技術報告正式發布才能見分曉。

但這不妨礙我們先興奮一下。

首枚自研芯片發布背后, 是Open AI的全棧野心?

Open AI的“全棧”野心,不只是造顆芯片

Jalapeño意為墨西哥辣椒,屬于辣度最溫和的品種。

起這個名字,其實也是Open AI在暗示:Jalapeño只是第一步,以后面還有更“辣”的。

首枚自研芯片發布背后, 是Open AI的全棧野心?

以前Open AI的活法很簡單:只管專心搞模型,至于算力和數據中心,全丟給微軟和英偉達去頭疼。

這讓他們在早期的模型軍備競賽里跑得飛快,但也埋下一個結構性隱患——算力成本的定價權,不攥在自己手里。

命門在別人手上,交租得看房東臉色。

而Open AI今天面對的競爭環境,已經和兩三年前完全不同了。

在過去,模型能力是最大的競爭變量,只要能把模型做得更聰明,算力貴一點還能忍。但進入Agent、AI編程、AI視頻等新階段后,模型能力正在逐漸趨同,真正拉開差距的,開始變成誰能以更低的成本、更大的規模,把智能戰力持續送到用戶手里。

換句話說,AI競爭正在從“誰模型最好”轉向“誰交付智能的效率最高”。而推理芯片,恰恰就是決定這種效率的底層基礎設施。

2025年秋天之后,Open AI的動作明顯變了節奏。

首枚自研芯片發布背后, 是Open AI的全棧野心?

先是和博通宣布合作搞自研加速器,緊接著跟英偉達簽了千億美元級別的數據中心協議,又和AMD鎖定了6GW的芯片供應,2026年6月還跟Cerebras談下了750MW的推理算力訂單。

加上這次Jalape?o芯片正式亮相,四條路線齊頭并進:

自研芯片、英偉達、AMD、Cerebras。

現在看,你還會覺得Open AI是一家單純“做模型的公司”嗎?

顯然不會了。

從更長遠來看,自研芯片的意義,甚至不只是節省成本。

AI行業正在進入一個新的競爭階段:模型、芯片、網絡、數據中心、軟件棧開始越來越緊密地耦合在一起。未來真正領先的AI公司,比拼的可能不再只是某一個模型,而是整套基礎設施是否能夠協同優化。

就像蘋果通過自研M系列芯片,把硬件、操作系統和應用生態整合成一個整體一樣,Open AI也正在嘗試把模型、推理系統和底層硬件一起設計。這意味著,它希望優化的不只是某一個模型,而是整個AI服務鏈路。

而且Open AI的IPO籌備正在路上。在這個節點上推出自研芯片,就是在非常明確的向投資市場傳遞信號:這家公司有辦法、有計劃把推理成本這個最大的出血點給堵上。

財務敘事和技術敘事在此匯合。

合作模式上,Open AI選了一條務實路線。

芯片架構、內核優化、服務系統由自己主導;硅實現和網絡互聯交給博通(谷歌TPU就是通過博通量產的,這條路已經跑通過);板卡、機架和系統集成則交給了加拿大的Celestica,順帶一提,這家公司同樣是谷歌TPU的首選制造伙伴。

三家拼起了一張完整的拼圖。

博通CEO陳福陽把這次合作稱為“一項根本性承諾”,不是一次性項目,而是一個多代際路線圖的起點。

Jalape?o只是開始,根據此前媒體報道,第二代芯片的代號叫“Serrano”,同樣是一種辣椒。

部署時間線也定了,2026年底開始初步部署,之后逐年擴展,最終目標是和微軟等合作伙伴一起,建設吉瓦(GW)級別的數據中心。

吉瓦是什么概念?

大約相當于整個北京市的居民用電量。這種量級的電力調度,本身就是一種基礎設施建設能力的終極壓力測試。

Open AI正在從一家AI實驗室,蛻變成一家全棧AI公司。

模型自己訓,芯片自己設計,推理自己優化,部署自己控制。

首枚自研芯片發布背后, 是Open AI的全棧野心?

你的ChatGPT賬單,正在被重寫

說了這么多,這些跟我們普通人有什么關系?

關系大了,以后我們用的AI將會越來越“物美價廉”。

Greg Brockman在發布時說過:“世界正在轉向一個由算力驅動的經濟。”

首枚自研芯片發布背后, 是Open AI的全棧野心?

這話聽著大,但細想不虛。

無論是學生想借助AI理解一篇論文,還是小企業用API搭建一個客服系統,又或者獨立開發者靠代碼助手完成一個項目,背后都是算力在悄悄做功。

而算力成本的高低,直接決定了這些東西是少數人的工具,還是多數人的日常。

Open AI把Jalape?o定位在推理側,本質上是在做一件事:讓智能變得更便宜、更快、更穩定。

每次推理延遲少一秒,每個API調用價格降一分,落到每一個普通人那里,就是能用更少的錢,更順暢地使用AI,甚至用上那些今天還只屬于大企業和付費用戶的高級能力。

打個比方,你以前每月花錢訂閱,請回來的就是個能陪你侃大山的“高級AI陪聊”。但到了明年,同樣的價錢,你請回來的可能是個能幫你把整份PPT做完、順便把Excel表也清理了的“全能實習生”。

價格沒變,但“打工人”的段位飆升了好幾級,加量不加價。

當然,不只是花錢的用戶。當算力變得跟水電一樣便宜,曾經只有大廠才燒得起“最強大腦”,以后可能就變成每個人隨手就能用的標配工具。

首枚自研芯片發布背后, 是Open AI的全棧野心?

寫在最后

回過頭來看整件事,最妙的其實是這個循環:

AI設計芯片 → 芯片跑AI → 更強的AI設計下一代芯片。

更好的基礎設施→更高的算力效率→更好的訓練和服務→更強的模型→更好的產品→更多用戶和收入→再投入下一代基礎設施。

這個飛輪一旦轉起來,就是自我加速的。

Google有TPU,Amazon有Trainium,Meta有MTIA,微軟有Maia。OpenAI現在也有Jalape?o了。

這個飛輪一旦轉起來,就是自我加速的。

Google有TPU,Amazon有Trainium,Meta有MTIA,微軟有Maia。OpenAI現在也有Jalape?o了。

大模型公司造芯片,正在從“要不要”變成“能不能”的問題。

當然,從流片到大規模量產,中間還有良率、供應鏈、軟件生態等一系列問題要解決。

要知道,英偉達那個CUDA平臺,就像是AI界的“通用語言”或“水電網絡”,大家用了十幾年,早就習慣成自然了。現在你想讓所有人換套新系統?那難度不亞于讓全國司機一夜之間改靠左行駛。

再看看前面的老大哥:谷歌的TPU打磨了十年才有今天,亞馬遜的Inferentia也是踩了無數個坑、迭代了好幾輪才敢大規模鋪開。

Open AI想憑一顆“辣椒”就一步登天?路還長著呢。

Jalape?o的出世至少證明了一件事:AI不僅能幫人干活,還能幫自己造“身體” 。

用最懂LLM的模型,設計最跑LLM的硬件,一旦這個循環跑起來,那個“算力更便宜、AI更普及”的未來,將會加速到來。

首枚自研芯片發布背后, 是Open AI的全棧野心?

       原文標題 : 首枚自研芯片發布背后,是Open AI的全棧野心?

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關注公眾號
    OFweek人工智能網
    獲取更多精彩內容
    文章糾錯
    x
    *文字標題:
    *糾錯內容:
    聯系郵箱:
    *驗 證 碼:

    粵公網安備 44030502002758號