成人免费午夜精品一区二区-亚洲视频在线观看久久-国产原创自拍看在线视频-这里只有精品自拍偷拍亚洲色图-亚洲变态另类色图天堂网-国产欧美日韩亚洲一区-国产精品自拍35页-男人插入女人下面的真实视频-蜜桃臀一区二区三区精品视频

訂閱
糾錯(cuò)
加入自媒體

趨勢丨AI推理的未來方向是全系統(tǒng)運(yùn)算解決方案

前言:

4月初,AI基礎(chǔ)設(shè)施領(lǐng)域出現(xiàn)了一筆引人注目的收購。生成式AI推理計(jì)算先驅(qū)d-Matrix宣布收購加州卡爾斯巴德GigaIO公司的數(shù)據(jù)中心業(yè)務(wù)。雙方合作始于2025年,彼時(shí)d-Matrix將Corsair推理平臺(tái)集成至GigaIO的SuperNODE架構(gòu),打造了單節(jié)點(diǎn)支持?jǐn)?shù)十個(gè)Corsair加速器的超大規(guī)模方案。

如今,這筆交易將GigaIO的FabreX PCIe內(nèi)存結(jié)構(gòu)與SuperNODE平臺(tái)完整納入d-Matrix的產(chǎn)品版圖。創(chuàng)始人兼CEO Sid Sheth對此的定位極為清晰——“推理大于任何單一芯片,它現(xiàn)在是一個(gè)系統(tǒng)問題。”

作者 | 方文三

圖片來源 |  網(wǎng) 絡(luò) 

從單一芯片到機(jī)架級基礎(chǔ)設(shè)施

什么是“全系統(tǒng)運(yùn)算解決方案”?它意味著AI推理的競爭不再圍繞單一芯片的算力參數(shù)展開,而是轉(zhuǎn)向覆蓋加速器、網(wǎng)絡(luò)、內(nèi)存互聯(lián)、軟件棧乃至整個(gè)機(jī)架的端到端能力。這起收購建立在雙方始于2025年的合作基礎(chǔ)上,旨在增強(qiáng)d-Matrix提供系統(tǒng)級AI基礎(chǔ)設(shè)施而非離散硅片的能力。

GigaIO開發(fā)的可組合基礎(chǔ)設(shè)施FabreX,基于PCIe標(biāo)準(zhǔn)的可組合內(nèi)存結(jié)構(gòu),支持跨節(jié)點(diǎn)構(gòu)建解耦的計(jì)算與內(nèi)存池,能在機(jī)架或集群級別進(jìn)行動(dòng)態(tài)配置。這項(xiàng)技術(shù)與d-Matrix原有的Corsair推理加速器、JetStream網(wǎng)絡(luò)和Aviator軟件,以及同博通、Arista聯(lián)合開發(fā)的SquadRack機(jī)架級參考架構(gòu)形成完整閉環(huán)。從更宏觀的產(chǎn)業(yè)視角看,全系統(tǒng)方向已成為頭部企業(yè)的共識。2026年GTC大會(huì)上,英偉達(dá)產(chǎn)品形態(tài)已從單一GPU升級為“芯片—機(jī)架—數(shù)據(jù)中心”一體化系統(tǒng),標(biāo)志著算力競爭重心躍遷至數(shù)據(jù)中心級平臺(tái)。d-Matrix的收購戰(zhàn)略與這一趨勢完全同頻。

d-Matrix的前瞻判斷:內(nèi)存帶寬才是真正的瓶頸

d-Matrix選擇了一條與GPU陣營截然不同的技術(shù)路徑。當(dāng)英偉達(dá)2019年在AI訓(xùn)練領(lǐng)域確立統(tǒng)治地位后,創(chuàng)始人Sheth沒有押注訓(xùn)練芯片,而是聚焦推理。“除非你有實(shí)質(zhì)性的差異化,否則嘗試在那里做些什么將是愚蠢的差事。”

d-Matrix的核心判斷是:對于基于Transformer的推理,瓶頸從來不是計(jì)算,而是移動(dòng)權(quán)重。數(shù)據(jù)在計(jì)算核心與內(nèi)存之間的搬運(yùn)構(gòu)成了核心延遲來源。為此,他們研發(fā)了數(shù)字內(nèi)存計(jì)算技術(shù)——矩陣乘法直接在內(nèi)存單元內(nèi)發(fā)生,內(nèi)存塊本身充當(dāng)計(jì)算塊,通過嵌入式加法器樹完成求和運(yùn)算,為AI推理提供更高效的硬件解決方案。該平臺(tái)基于SRAM而非HBM,專為Transformer工作負(fù)載定制,Corsair在芯片內(nèi)部配置了大容量SRAM與LPDDR5X,讓矩陣運(yùn)算盡可能靠近存儲(chǔ)發(fā)生,從而降低數(shù)據(jù)搬運(yùn)的能耗與延遲。此外,d-Matrix還規(guī)劃了3D DRAM內(nèi)存堆疊創(chuàng)新,將內(nèi)存容量擴(kuò)展至3D維度,承諾相比當(dāng)前行業(yè)標(biāo)準(zhǔn)HBM4,能夠?qū)I模型運(yùn)行速度提升10倍,并將能耗降低高達(dá)90%。

這種從底層架構(gòu)層面的重構(gòu),體現(xiàn)的是對推理場景本質(zhì)需求的深刻洞察。正如d-Matrix所表達(dá)的,他們將考慮“三個(gè)主要的障礙”來實(shí)現(xiàn)快速、高效、高性能的AI推理,而內(nèi)存帶寬正是其中最核心的一道壁壘。Sheth的表述清晰地闡明了全系統(tǒng)方向的演進(jìn)邏輯:“我們知道需要一些特殊的東西,一些更高效的東西,不僅僅解決計(jì)算問題,還要解決計(jì)算、內(nèi)存、內(nèi)存帶寬、內(nèi)存容量以及所有這些問題。”

市場信號:融資節(jié)奏與客戶卡位

d-Matrix的全系統(tǒng)路線獲得了資本的強(qiáng)烈認(rèn)可。2025年11月,公司完成2.75億美元C輪融資,估值達(dá)20億美元,累計(jì)融資4.5億美元,參與方包括歐洲科技投資公司Bullhound Capital、新加坡主權(quán)財(cái)富基金淡馬錫等,微軟旗下風(fēng)險(xiǎn)投資基金M12、卡塔爾投資局和EDBI也參與了本輪投資。這些頂級投資機(jī)構(gòu)的入局,是對d-Matrix技術(shù)路線和商業(yè)前景的有力背書。

產(chǎn)品層面,Corsair平臺(tái)性能參數(shù)已相當(dāng)亮眼。在Llama 70B模型上可實(shí)現(xiàn)3萬Token/秒的吞吐量、每Token僅2毫秒延遲;在Llama 8B模型上,單臺(tái)服務(wù)器即可實(shí)現(xiàn)6萬Token/秒、每Token 1毫秒的極致性能。此外,據(jù)稱其方案相比使用HBM的替代方案,在性能模式下可將交互式延遲降低高達(dá)10倍。Sheth聲稱其解決方案在成本、能效和速度上分別優(yōu)于GPU 2-3倍、5-10倍和近10倍。

目標(biāo)客戶覆蓋超大規(guī)模云廠商、前沿AI實(shí)驗(yàn)室和企業(yè)級部署。超級計(jì)算機(jī)等合作伙伴正在將d-Matrix方案推向市場。Sheth預(yù)計(jì)收購將加速收入節(jié)奏,并在異構(gòu)系統(tǒng)的機(jī)架配置中支撐新的定價(jià)模式。

AI推理的拐點(diǎn)時(shí)刻與全系統(tǒng)路徑的戰(zhàn)略意義

這筆收購之所以值得關(guān)注,根本上是因?yàn)锳I產(chǎn)業(yè)的需求結(jié)構(gòu)正在發(fā)生根本性轉(zhuǎn)變。德勤預(yù)計(jì),全球推理負(fù)載占AI算力的比例將從2023年的約三分之一提升至2026年的約三分之二。英偉達(dá)更是指出,過去兩年全球算力需求因推理任務(wù)快速增長達(dá)100萬倍。

正是在這一結(jié)構(gòu)性拐點(diǎn)面前,全系統(tǒng)運(yùn)算解決方案展現(xiàn)出獨(dú)特優(yōu)勢。當(dāng)推理工作負(fù)載日益分布式化、異構(gòu)化地跨CPU、GPU和推理加速器運(yùn)行時(shí),數(shù)據(jù)必須在芯片、節(jié)點(diǎn)、機(jī)架和整個(gè)數(shù)據(jù)中心之間實(shí)時(shí)高效移動(dòng)。擁有完整系統(tǒng)棧的企業(yè)能夠提供更低延遲、更高能效和更具成本競爭力的方案。銀河證券明確指出,算力競爭已從芯片層躍遷至數(shù)據(jù)中心級平臺(tái)。d-Matrix CEO Sheth的表達(dá)最為精準(zhǔn):“推理大于任何單一芯片。它現(xiàn)在是一個(gè)系統(tǒng)問題。”

結(jié)語:

從GigaIO數(shù)據(jù)中心業(yè)務(wù)的收購,到數(shù)字內(nèi)存計(jì)算技術(shù)的底層突破,再到推理算力需求的結(jié)構(gòu)性爆發(fā),一切趨勢表明,AI推理的未來在于系統(tǒng)級的整體優(yōu)化,而2026年的這場收購,不過是這場系統(tǒng)性競賽剛剛拉開的序幕。

網(wǎng)絡(luò)援引:

阿里云:《定義2026智算元年:解構(gòu)企業(yè)級人工智能應(yīng)用從“實(shí)驗(yàn)態(tài)”向“生產(chǎn)態(tài)”轉(zhuǎn)型的底層協(xié)議》

智通財(cái)經(jīng):《廣發(fā)證券:AI推理效率革新與Agent共振 打開萬億市場空間》

新浪財(cái)經(jīng):《數(shù)字經(jīng)濟(jì)周報(bào):GTC2026亮點(diǎn) AI從芯片競爭邁向系統(tǒng)競爭》

中國科技網(wǎng):《Token爆發(fā)元年!2026中關(guān)村論壇年會(huì)分論壇共話AI大規(guī)模推理服務(wù)新圖景》

       原文標(biāo)題 : 趨勢丨AI推理的未來方向是全系統(tǒng)運(yùn)算解決方案

聲明: 本文由入駐維科號的作者撰寫,觀點(diǎn)僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報(bào)。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個(gè)字

您提交的評論過于頻繁,請輸入驗(yàn)證碼繼續(xù)

  • 看不清,點(diǎn)擊換一張  刷新

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯(cuò)
    x
    *文字標(biāo)題:
    *糾錯(cuò)內(nèi)容:
    聯(lián)系郵箱:
    *驗(yàn) 證 碼:

    粵公網(wǎng)安備 44030502002758號