趨勢(shì)丨HBM升級(jí)=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”
前言:當(dāng)AI大模型的參數(shù)規(guī)模邁向萬億級(jí),上下文窗口突破百萬token,HBM(高帶寬內(nèi)存)雖快,但容量有限且成本高昂;NAND閃存雖大,但帶寬不足。在這個(gè)算力與存儲(chǔ)的斷層之間,一種名為HBF(高帶寬閃存)的新型存儲(chǔ)技術(shù)正從實(shí)驗(yàn)室走向產(chǎn)業(yè)前臺(tái)。
從HBM到HBF的“升級(jí)”邏輯
HBF(High Bandwidth Flash,高帶寬閃存)并非HBM的簡(jiǎn)單替代,而是以NAND堆疊之軀,實(shí)現(xiàn)接近HBM的帶寬,試圖在AI推理時(shí)代扮演“二級(jí)緩存”的戰(zhàn)略角色。一場(chǎng)圍繞HBF的技術(shù)競(jìng)賽,已在存儲(chǔ)巨頭之間悄然打響。其核心設(shè)計(jì)理念是:在GPU或AI加速器旁,部署一層容量遠(yuǎn)超HBM、帶寬又遠(yuǎn)高于傳統(tǒng)SSD的“中間層”存儲(chǔ)。
從技術(shù)實(shí)現(xiàn)看,HBM堆疊的是DRAM,而HBF堆疊的是NAND閃存。第一代HBF產(chǎn)品預(yù)計(jì)將堆疊16層32GB NAND閃存,總?cè)萘靠蛇_(dá)512GB,帶寬則有望超過1638GB/s(相當(dāng)于PCIe 6.0×4的50倍)。在AI計(jì)算架構(gòu)中,HBF扮演的是HBM的“容量擴(kuò)展”角色。
AI推理時(shí)代的“內(nèi)存墻”困局
HBF的誕生,直指當(dāng)前AI計(jì)算體系中最棘手的矛盾——HBM的容量增長(zhǎng)遠(yuǎn)跟不上模型參數(shù)的膨脹速度。在AI大模型的推理階段,特別是長(zhǎng)上下文、多輪對(duì)話、智能體調(diào)用等場(chǎng)景中,系統(tǒng)需要頻繁讀寫鍵值緩存(KV cache)來維持上下文記憶。當(dāng)上下文窗口達(dá)到百萬token級(jí)別時(shí),HBM很快被這些緩存數(shù)據(jù)占滿,進(jìn)而影響核心計(jì)算任務(wù)的效率。
傳統(tǒng)解決方案是通過向量重計(jì)算或訪問遠(yuǎn)端SSD來應(yīng)對(duì)溢出數(shù)據(jù),但這兩種方式都會(huì)引入顯著的延遲開銷。HBF的介入,正是為了填補(bǔ)HBM與SSD之間的巨大空白。SK海力士提出的H3(HBM+HBF)混合存儲(chǔ)架構(gòu),將HBF作為HBM的“二級(jí)擴(kuò)展”,專門存儲(chǔ)只讀數(shù)據(jù)或鍵值緩存。經(jīng)過模擬表明,以前需要32個(gè)GPU才能完成的工作負(fù)載,在HBF的輔助下僅需2個(gè)GPU即可完成。這意味著HBF不僅能突破容量瓶頸,更可能從根本上改變AI算力集群的經(jīng)濟(jì)模型。
技術(shù)特征:容量、帶寬與成本的再平衡
HBF之所以被寄予厚望,源于其在容量、帶寬和成本三個(gè)維度上實(shí)現(xiàn)了獨(dú)特的再平衡。其中,容量?jī)?yōu)勢(shì)最為突出。HBF的存儲(chǔ)容量可達(dá)HBM的8至16倍。這意味著原本需要多個(gè)GPU分?jǐn)偟哪P蛥?shù)和緩存數(shù)據(jù),可以更集中地由單個(gè)GPU配合HBF處理,大幅降低系統(tǒng)復(fù)雜度和互連開銷。
帶寬表現(xiàn)上,HBF能夠?qū)崿F(xiàn)HBM約80%至90% 的傳輸速度。雖然仍有一定差距,但考慮到其容量?jī)?yōu)勢(shì),這一帶寬水平已足以支撐絕大多數(shù)推理場(chǎng)景的數(shù)據(jù)供給需求。功耗方面與HBM相比,HBF的功耗可降低約40%。這對(duì)于功耗密度日益失控的AI集群而言,意義重大。
成本上,基于NAND閃存的HBF,其單位容量的成本遠(yuǎn)低于基于DRAM的HBM。廣發(fā)證券分析認(rèn)為,HBF有望將GPU的存儲(chǔ)容量擴(kuò)展至4TB,成為滿足AI大模型內(nèi)存容量要求的最佳方案。
當(dāng)然,HBF也存在先天短板:由于NAND閃存的物理特性,其寫入耐久性較差,訪問延遲高于DRAM。因此,當(dāng)前的主流設(shè)計(jì)思路是將HBF用于只讀數(shù)據(jù)或低頻寫入的鍵值緩存,而將頻繁讀寫的動(dòng)態(tài)數(shù)據(jù)留在HBM中。
全球巨頭入局競(jìng)爭(zhēng),韓系雙雄領(lǐng)跑
面對(duì)HBF的戰(zhàn)略價(jià)值,全球存儲(chǔ)巨頭已紛紛入局,其中韓國(guó)廠商占據(jù)領(lǐng)跑位置。SK海力士是當(dāng)前HBF研發(fā)最為積極的廠商,計(jì)劃最早于2026年推出HBF1樣品,目標(biāo)是在2027年實(shí)現(xiàn)量產(chǎn)。在戰(zhàn)略路徑上,SK海力士采取HBM中心策略,將HBF作為HBM的補(bǔ)充而非替代,通過兩者的協(xié)同配置優(yōu)化AI推理能效。
三星電子則展現(xiàn)出更宏大的野心,依托其在邏輯代工領(lǐng)域的優(yōu)勢(shì),三星正在探索通過自家4nm工藝生產(chǎn)HBF控制邏輯,并優(yōu)化下一代NAND方案的能效與控制性能。三星的目標(biāo)是將HBF整合進(jìn)更廣泛的AI內(nèi)存層級(jí)重構(gòu)中,其與閃迪的合作正向2027年底至2028年初應(yīng)用于英偉達(dá)、AMD、谷歌實(shí)際產(chǎn)品的目標(biāo)邁進(jìn)。
閃迪(SanDisk) 是HBF技術(shù)的最早倡導(dǎo)者之一,公司與韓國(guó)KAIST金正浩教授團(tuán)隊(duì)緊密合作,推動(dòng)HBF的技術(shù)標(biāo)準(zhǔn)化。閃迪認(rèn)為,HBF是解決GPU HBM內(nèi)存墻問題的關(guān)鍵答案,但其成功需要行業(yè)標(biāo)準(zhǔn)的確立和英偉達(dá)等主流客戶的采納。
值得注意的是,三大廠商已就HBF標(biāo)準(zhǔn)化展開合作。繼SK海力士之后,三星電子也加入了閃迪首創(chuàng)的HBF技術(shù)陣營(yíng),三方正共同推動(dòng)HBF成為行業(yè)通用標(biāo)準(zhǔn)。
從“HBM附庸”到“AI內(nèi)存新支柱”的未來展望
盡管前景廣闊,HBF的產(chǎn)業(yè)化仍面臨多重挑戰(zhàn)。技術(shù)層面,HBF需要GPU制造商重新設(shè)計(jì)架構(gòu),開發(fā)者需要修改軟件以優(yōu)化軟硬件協(xié)同,這些涉及大量半導(dǎo)體級(jí)別的復(fù)雜工作。
生態(tài)層面,英偉達(dá)的態(tài)度至關(guān)重要。目前,英偉達(dá)尚未對(duì)HBF表達(dá)公開興趣,而是開發(fā)了ICMSP技術(shù)作為替代方案,使用DPU連接的NVMe SSD處理溢出數(shù)據(jù)。不過,隨著SK海力士、三星等核心供應(yīng)商持續(xù)推動(dòng),以及HBF在仿真測(cè)試中展現(xiàn)的驚人能效提升,英偉達(dá)的態(tài)度可能出現(xiàn)轉(zhuǎn)變。
證券機(jī)構(gòu)預(yù)測(cè),HBF市場(chǎng)規(guī)模將從2027年的10億美元增長(zhǎng)至2030年的120億美元。金正浩教授更預(yù)測(cè),從2038年起,HBF的需求將超過HBM。在商業(yè)化時(shí)間表上,SK海力士有望在本月晚些時(shí)候展示HBF早期測(cè)試版本,而HBF的廣泛應(yīng)用預(yù)計(jì)將等到HBM6時(shí)代——屆時(shí)單個(gè)基礎(chǔ)裸片將集成多組存儲(chǔ)堆棧。
結(jié)語
在推理成為AI算力新主戰(zhàn)場(chǎng)的2026年,誰能率先構(gòu)建HBM+HBF的混合存儲(chǔ)體系,誰就可能在這場(chǎng)算力效率的終極競(jìng)賽中占得先機(jī),開啟AI算力的下一個(gè)黃金十年。
網(wǎng)絡(luò)援引:
搜狐網(wǎng):《SK海力士探索H3存儲(chǔ):發(fā)揮HBM、HBF各自優(yōu)勢(shì),優(yōu)化推理能效 》
中關(guān)村在線:《全球存儲(chǔ)巨頭加速AI驅(qū)動(dòng)產(chǎn)能擴(kuò)張,美光2000億美元建最大潔凈室》
IT之家:《消息稱美光痛失英偉達(dá)HBM4 大單,韓系雙雄 SK 海力士、三星瓜分市場(chǎng)》
原文標(biāo)題 : 趨勢(shì)丨HBM升級(jí)=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”
發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
圖片新聞
-

落地?zé)o錫!京東首個(gè)物流機(jī)器人超級(jí)工廠來了
-

OpenAI發(fā)布的AI瀏覽器,市場(chǎng)為何反應(yīng)強(qiáng)烈?
-

馬云重返一線督戰(zhàn),阿里重啟創(chuàng)始人模式
-

機(jī)器人奧運(yùn)會(huì)戰(zhàn)報(bào):宇樹機(jī)器人摘下首金,天工Ultra搶走首位“百米飛人”
-

存儲(chǔ)圈掐架!江波龍起訴佰維,索賠121萬
-

長(zhǎng)安汽車母公司突然更名:從“中國(guó)長(zhǎng)安”到“辰致科技”
-

豆包前負(fù)責(zé)人喬木出軌BP后續(xù):均被辭退
-

字節(jié)AI Lab負(fù)責(zé)人李航卸任后返聘,Seed進(jìn)入調(diào)整期
最新活動(dòng)更多
-
6月30日立即申請(qǐng)?jiān)囉?> 【免費(fèi)試用】旭之源工業(yè)電源一一機(jī)器人的穩(wěn)定“心臟“
-
精彩回顧立即查看>> 【限時(shí)免費(fèi)】物理場(chǎng)仿真助力生物醫(yī)學(xué)領(lǐng)域技術(shù)創(chuàng)新
-
精彩回顧立即查看>> 【直播】 智測(cè)未來·2026海克斯康春季產(chǎn)品創(chuàng)新日
-
精彩回顧立即查看>> 【線下論壇】新唐科技×芯唐南京 2026 年度研討會(huì)
-
精彩回顧立即查看>> OFweek 2026(第十五屆)中國(guó)機(jī)器人產(chǎn)業(yè)大會(huì)
-
精彩回顧立即查看>> 維科杯· OFweek 2025中國(guó)機(jī)器人行業(yè)年度評(píng)選
推薦專題
-
2 華為,重大突破!
- 1 人形機(jī)器人“第一股”來了!宇樹科技即將上會(huì)
- 2 全球股市陷AI獨(dú)大結(jié)構(gòu)性瘋狂
- 3 AI狂歡遇上油價(jià)破百,全球股市還能漲多久? | 產(chǎn)聯(lián)看全球
- 4 DeepSeek融資500億,梁文鋒難逃資本局
- 5 谷歌2026 I/O大會(huì)完整回顧:模型依然重要,但智能體正在接管一切
- 6 全球資本,重倉中國(guó)機(jī)器人
- 7 Figure AI 交付突破350臺(tái),陪跑特斯拉會(huì)迎來iPhone 時(shí)刻嗎?
- 8 Anthropic發(fā)布2028年全球AI領(lǐng)導(dǎo)力的兩種情景報(bào)告
- 9 “國(guó)產(chǎn)GPU第一股”摩爾線程首季扭虧,但造血能力仍待考驗(yàn)
- 10 特斯拉宣布監(jiān)督版FSD登陸中國(guó)?
- 高級(jí)軟件工程師 廣東省/深圳市
- 自動(dòng)化高級(jí)工程師 廣東省/深圳市
- 光器件研發(fā)工程師 福建省/福州市
- 銷售總監(jiān)(光器件) 北京市/海淀區(qū)
- 激光器高級(jí)銷售經(jīng)理 上海市/虹口區(qū)
- 光器件物理工程師 北京市/海淀區(qū)
- 激光研發(fā)工程師 北京市/昌平區(qū)
- 技術(shù)專家 廣東省/江門市
- 封裝工程師 北京市/海淀區(qū)
- 結(jié)構(gòu)工程師 廣東省/深圳市


分享





