123,123

趨勢丨HBM升級=HBF？高帶寬閃存如何破解AI算力的“內(nèi)存墻”

2026-02-28 14:56

前言：當(dāng)AI大模型的參數(shù)規(guī)模邁向萬億級，上下文窗口突破百萬token，HBM（高帶寬內(nèi)存）雖快，但容量有限且成本高昂；NAND閃存雖大，但帶寬不足。在這個算力與存儲的斷層之間，一種名為HBF（高帶寬閃存）的新型存儲技術(shù)正從實驗室走向產(chǎn)業(yè)前臺。

從HBM到HBF的“升級”邏輯

HBF（High Bandwidth Flash，高帶寬閃存）并非HBM的簡單替代，而是以NAND堆疊之軀，實現(xiàn)接近HBM的帶寬，試圖在AI推理時代扮演“二級緩存”的戰(zhàn)略角色。一場圍繞HBF的技術(shù)競賽，已在存儲巨頭之間悄然打響。其核心設(shè)計理念是：在GPU或AI加速器旁，部署一層容量遠(yuǎn)超HBM、帶寬又遠(yuǎn)高于傳統(tǒng)SSD的“中間層”存儲。

從技術(shù)實現(xiàn)看，HBM堆疊的是DRAM，而HBF堆疊的是NAND閃存。第一代HBF產(chǎn)品預(yù)計將堆疊16層32GB NAND閃存，總?cè)萘靠蛇_(dá)512GB，帶寬則有望超過1638GB/s（相當(dāng)于PCIe 6.0×4的50倍）。在AI計算架構(gòu)中，HBF扮演的是HBM的“容量擴(kuò)展”角色。

AI推理時代的“內(nèi)存墻”困局

HBF的誕生，直指當(dāng)前AI計算體系中最棘手的矛盾——HBM的容量增長遠(yuǎn)跟不上模型參數(shù)的膨脹速度。在AI大模型的推理階段，特別是長上下文、多輪對話、智能體調(diào)用等場景中，系統(tǒng)需要頻繁讀寫鍵值緩存（KV cache）來維持上下文記憶。當(dāng)上下文窗口達(dá)到百萬token級別時，HBM很快被這些緩存數(shù)據(jù)占滿，進(jìn)而影響核心計算任務(wù)的效率。

傳統(tǒng)解決方案是通過向量重計算或訪問遠(yuǎn)端SSD來應(yīng)對溢出數(shù)據(jù)，但這兩種方式都會引入顯著的延遲開銷。HBF的介入，正是為了填補(bǔ)HBM與SSD之間的巨大空白。SK海力士提出的H3（HBM+HBF）混合存儲架構(gòu)，將HBF作為HBM的“二級擴(kuò)展”，專門存儲只讀數(shù)據(jù)或鍵值緩存。經(jīng)過模擬表明，以前需要32個GPU才能完成的工作負(fù)載，在HBF的輔助下僅需2個GPU即可完成。這意味著HBF不僅能突破容量瓶頸，更可能從根本上改變AI算力集群的經(jīng)濟(jì)模型。

技術(shù)特征：容量、帶寬與成本的再平衡

HBF之所以被寄予厚望，源于其在容量、帶寬和成本三個維度上實現(xiàn)了獨特的再平衡。其中，容量優(yōu)勢最為突出。HBF的存儲容量可達(dá)HBM的8至16倍。這意味著原本需要多個GPU分?jǐn)偟哪Ｐ蛥?shù)和緩存數(shù)據(jù)，可以更集中地由單個GPU配合HBF處理，大幅降低系統(tǒng)復(fù)雜度和互連開銷。

帶寬表現(xiàn)上，HBF能夠?qū)崿F(xiàn)HBM約80%至90% 的傳輸速度。雖然仍有一定差距，但考慮到其容量優(yōu)勢，這一帶寬水平已足以支撐絕大多數(shù)推理場景的數(shù)據(jù)供給需求。功耗方面與HBM相比，HBF的功耗可降低約40%。這對于功耗密度日益失控的AI集群而言，意義重大。

成本上，基于NAND閃存的HBF，其單位容量的成本遠(yuǎn)低于基于DRAM的HBM。廣發(fā)證券分析認(rèn)為，HBF有望將GPU的存儲容量擴(kuò)展至4TB，成為滿足AI大模型內(nèi)存容量要求的最佳方案。

當(dāng)然，HBF也存在先天短板：由于NAND閃存的物理特性，其寫入耐久性較差，訪問延遲高于DRAM。因此，當(dāng)前的主流設(shè)計思路是將HBF用于只讀數(shù)據(jù)或低頻寫入的鍵值緩存，而將頻繁讀寫的動態(tài)數(shù)據(jù)留在HBM中。

全球巨頭入局競爭，韓系雙雄領(lǐng)跑

面對HBF的戰(zhàn)略價值，全球存儲巨頭已紛紛入局，其中韓國廠商占據(jù)領(lǐng)跑位置。SK海力士是當(dāng)前HBF研發(fā)最為積極的廠商，計劃最早于2026年推出HBF1樣品，目標(biāo)是在2027年實現(xiàn)量產(chǎn)。在戰(zhàn)略路徑上，SK海力士采取HBM中心策略，將HBF作為HBM的補(bǔ)充而非替代，通過兩者的協(xié)同配置優(yōu)化AI推理能效。

三星電子則展現(xiàn)出更宏大的野心，依托其在邏輯代工領(lǐng)域的優(yōu)勢，三星正在探索通過自家4nm工藝生產(chǎn)HBF控制邏輯，并優(yōu)化下一代NAND方案的能效與控制性能。三星的目標(biāo)是將HBF整合進(jìn)更廣泛的AI內(nèi)存層級重構(gòu)中，其與閃迪的合作正向2027年底至2028年初應(yīng)用于英偉達(dá)、AMD、谷歌實際產(chǎn)品的目標(biāo)邁進(jìn)。

閃迪（SanDisk）是HBF技術(shù)的最早倡導(dǎo)者之一，公司與韓國KAIST金正浩教授團(tuán)隊緊密合作，推動HBF的技術(shù)標(biāo)準(zhǔn)化。閃迪認(rèn)為，HBF是解決GPU HBM內(nèi)存墻問題的關(guān)鍵答案，但其成功需要行業(yè)標(biāo)準(zhǔn)的確立和英偉達(dá)等主流客戶的采納。

值得注意的是，三大廠商已就HBF標(biāo)準(zhǔn)化展開合作。繼SK海力士之后，三星電子也加入了閃迪首創(chuàng)的HBF技術(shù)陣營，三方正共同推動HBF成為行業(yè)通用標(biāo)準(zhǔn)。

從“HBM附庸”到“AI內(nèi)存新支柱”的未來展望

盡管前景廣闊，HBF的產(chǎn)業(yè)化仍面臨多重挑戰(zhàn)。技術(shù)層面，HBF需要GPU制造商重新設(shè)計架構(gòu)，開發(fā)者需要修改軟件以優(yōu)化軟硬件協(xié)同，這些涉及大量半導(dǎo)體級別的復(fù)雜工作。

生態(tài)層面，英偉達(dá)的態(tài)度至關(guān)重要。目前，英偉達(dá)尚未對HBF表達(dá)公開興趣，而是開發(fā)了ICMSP技術(shù)作為替代方案，使用DPU連接的NVMe SSD處理溢出數(shù)據(jù)。不過，隨著SK海力士、三星等核心供應(yīng)商持續(xù)推動，以及HBF在仿真測試中展現(xiàn)的驚人能效提升，英偉達(dá)的態(tài)度可能出現(xiàn)轉(zhuǎn)變。

證券機(jī)構(gòu)預(yù)測，HBF市場規(guī)模將從2027年的10億美元增長至2030年的120億美元。金正浩教授更預(yù)測，從2038年起，HBF的需求將超過HBM。在商業(yè)化時間表上，SK海力士有望在本月晚些時候展示HBF早期測試版本，而HBF的廣泛應(yīng)用預(yù)計將等到HBM6時代——屆時單個基礎(chǔ)裸片將集成多組存儲堆棧。

結(jié)語

在推理成為AI算力新主戰(zhàn)場的2026年，誰能率先構(gòu)建HBM+HBF的混合存儲體系，誰就可能在這場算力效率的終極競賽中占得先機(jī)，開啟AI算力的下一個黃金十年。

網(wǎng)絡(luò)援引：

搜狐網(wǎng)：《SK海力士探索H3存儲：發(fā)揮HBM、HBF各自優(yōu)勢，優(yōu)化推理能效》

中關(guān)村在線：《全球存儲巨頭加速AI驅(qū)動產(chǎn)能擴(kuò)張，美光2000億美元建最大潔凈室》

IT之家：《消息稱美光痛失英偉達(dá)HBM4 大單，韓系雙雄 SK 海力士、三星瓜分市場》

原文標(biāo)題 : 趨勢丨HBM升級=HBF？高帶寬閃存如何破解AI算力的“內(nèi)存墻”