訂閱
糾錯
加入自媒體

趨勢丨HBM升級=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”

前言:當(dāng)AI大模型的參數(shù)規(guī)模邁向萬億級,上下文窗口突破百萬token,HBM(高帶寬內(nèi)存)雖快,但容量有限且成本高昂;NAND閃存雖大,但帶寬不足。在這個算力與存儲的斷層之間,一種名為HBF(高帶寬閃存)的新型存儲技術(shù)正從實驗室走向產(chǎn)業(yè)前臺。

從HBM到HBF的“升級”邏輯

HBF(High Bandwidth Flash,高帶寬閃存)并非HBM的簡單替代,而是以NAND堆疊之軀,實現(xiàn)接近HBM的帶寬,試圖在AI推理時代扮演“二級緩存”的戰(zhàn)略角色。一場圍繞HBF的技術(shù)競賽,已在存儲巨頭之間悄然打響。其核心設(shè)計理念是:在GPU或AI加速器旁,部署一層容量遠(yuǎn)超HBM、帶寬又遠(yuǎn)高于傳統(tǒng)SSD的“中間層”存儲。

從技術(shù)實現(xiàn)看,HBM堆疊的是DRAM,而HBF堆疊的是NAND閃存。第一代HBF產(chǎn)品預(yù)計將堆疊16層32GB NAND閃存,總?cè)萘靠蛇_(dá)512GB,帶寬則有望超過1638GB/s(相當(dāng)于PCIe 6.0×4的50倍)。在AI計算架構(gòu)中,HBF扮演的是HBM的“容量擴(kuò)展”角色。

AI推理時代的“內(nèi)存墻”困局

HBF的誕生,直指當(dāng)前AI計算體系中最棘手的矛盾——HBM的容量增長遠(yuǎn)跟不上模型參數(shù)的膨脹速度。在AI大模型的推理階段,特別是長上下文、多輪對話、智能體調(diào)用等場景中,系統(tǒng)需要頻繁讀寫鍵值緩存(KV cache)來維持上下文記憶。當(dāng)上下文窗口達(dá)到百萬token級別時,HBM很快被這些緩存數(shù)據(jù)占滿,進(jìn)而影響核心計算任務(wù)的效率。

傳統(tǒng)解決方案是通過向量重計算或訪問遠(yuǎn)端SSD來應(yīng)對溢出數(shù)據(jù),但這兩種方式都會引入顯著的延遲開銷。HBF的介入,正是為了填補(bǔ)HBM與SSD之間的巨大空白。SK海力士提出的H3(HBM+HBF)混合存儲架構(gòu),將HBF作為HBM的“二級擴(kuò)展”,專門存儲只讀數(shù)據(jù)或鍵值緩存。經(jīng)過模擬表明,以前需要32個GPU才能完成的工作負(fù)載,在HBF的輔助下僅需2個GPU即可完成。這意味著HBF不僅能突破容量瓶頸,更可能從根本上改變AI算力集群的經(jīng)濟(jì)模型。

技術(shù)特征:容量、帶寬與成本的再平衡

HBF之所以被寄予厚望,源于其在容量、帶寬和成本三個維度上實現(xiàn)了獨特的再平衡。其中,容量優(yōu)勢最為突出。HBF的存儲容量可達(dá)HBM的8至16倍。這意味著原本需要多個GPU分?jǐn)偟哪P蛥?shù)和緩存數(shù)據(jù),可以更集中地由單個GPU配合HBF處理,大幅降低系統(tǒng)復(fù)雜度和互連開銷。

帶寬表現(xiàn)上,HBF能夠?qū)崿F(xiàn)HBM約80%至90% 的傳輸速度。雖然仍有一定差距,但考慮到其容量優(yōu)勢,這一帶寬水平已足以支撐絕大多數(shù)推理場景的數(shù)據(jù)供給需求。功耗方面與HBM相比,HBF的功耗可降低約40%。這對于功耗密度日益失控的AI集群而言,意義重大。

成本上,基于NAND閃存的HBF,其單位容量的成本遠(yuǎn)低于基于DRAM的HBM。廣發(fā)證券分析認(rèn)為,HBF有望將GPU的存儲容量擴(kuò)展至4TB,成為滿足AI大模型內(nèi)存容量要求的最佳方案。

當(dāng)然,HBF也存在先天短板:由于NAND閃存的物理特性,其寫入耐久性較差,訪問延遲高于DRAM。因此,當(dāng)前的主流設(shè)計思路是將HBF用于只讀數(shù)據(jù)或低頻寫入的鍵值緩存,而將頻繁讀寫的動態(tài)數(shù)據(jù)留在HBM中。

全球巨頭入局競爭,韓系雙雄領(lǐng)跑

面對HBF的戰(zhàn)略價值,全球存儲巨頭已紛紛入局,其中韓國廠商占據(jù)領(lǐng)跑位置。SK海力士是當(dāng)前HBF研發(fā)最為積極的廠商,計劃最早于2026年推出HBF1樣品,目標(biāo)是在2027年實現(xiàn)量產(chǎn)。在戰(zhàn)略路徑上,SK海力士采取HBM中心策略,將HBF作為HBM的補(bǔ)充而非替代,通過兩者的協(xié)同配置優(yōu)化AI推理能效。

三星電子則展現(xiàn)出更宏大的野心,依托其在邏輯代工領(lǐng)域的優(yōu)勢,三星正在探索通過自家4nm工藝生產(chǎn)HBF控制邏輯,并優(yōu)化下一代NAND方案的能效與控制性能。三星的目標(biāo)是將HBF整合進(jìn)更廣泛的AI內(nèi)存層級重構(gòu)中,其與閃迪的合作正向2027年底至2028年初應(yīng)用于英偉達(dá)、AMD、谷歌實際產(chǎn)品的目標(biāo)邁進(jìn)。

閃迪(SanDisk) 是HBF技術(shù)的最早倡導(dǎo)者之一,公司與韓國KAIST金正浩教授團(tuán)隊緊密合作,推動HBF的技術(shù)標(biāo)準(zhǔn)化。閃迪認(rèn)為,HBF是解決GPU HBM內(nèi)存墻問題的關(guān)鍵答案,但其成功需要行業(yè)標(biāo)準(zhǔn)的確立和英偉達(dá)等主流客戶的采納。

值得注意的是,三大廠商已就HBF標(biāo)準(zhǔn)化展開合作。繼SK海力士之后,三星電子也加入了閃迪首創(chuàng)的HBF技術(shù)陣營,三方正共同推動HBF成為行業(yè)通用標(biāo)準(zhǔn)。

從“HBM附庸”到“AI內(nèi)存新支柱”的未來展望

盡管前景廣闊,HBF的產(chǎn)業(yè)化仍面臨多重挑戰(zhàn)。技術(shù)層面,HBF需要GPU制造商重新設(shè)計架構(gòu),開發(fā)者需要修改軟件以優(yōu)化軟硬件協(xié)同,這些涉及大量半導(dǎo)體級別的復(fù)雜工作。

生態(tài)層面,英偉達(dá)的態(tài)度至關(guān)重要。目前,英偉達(dá)尚未對HBF表達(dá)公開興趣,而是開發(fā)了ICMSP技術(shù)作為替代方案,使用DPU連接的NVMe SSD處理溢出數(shù)據(jù)。不過,隨著SK海力士、三星等核心供應(yīng)商持續(xù)推動,以及HBF在仿真測試中展現(xiàn)的驚人能效提升,英偉達(dá)的態(tài)度可能出現(xiàn)轉(zhuǎn)變。

證券機(jī)構(gòu)預(yù)測,HBF市場規(guī)模將從2027年的10億美元增長至2030年的120億美元。金正浩教授更預(yù)測,從2038年起,HBF的需求將超過HBM。在商業(yè)化時間表上,SK海力士有望在本月晚些時候展示HBF早期測試版本,而HBF的廣泛應(yīng)用預(yù)計將等到HBM6時代——屆時單個基礎(chǔ)裸片將集成多組存儲堆棧。

結(jié)語

在推理成為AI算力新主戰(zhàn)場的2026年,誰能率先構(gòu)建HBM+HBF的混合存儲體系,誰就可能在這場算力效率的終極競賽中占得先機(jī),開啟AI算力的下一個黃金十年。

網(wǎng)絡(luò)援引:

搜狐網(wǎng):《SK海力士探索H3存儲:發(fā)揮HBM、HBF各自優(yōu)勢,優(yōu)化推理能效 》

中關(guān)村在線:《全球存儲巨頭加速AI驅(qū)動產(chǎn)能擴(kuò)張,美光2000億美元建最大潔凈室》

IT之家:《消息稱美光痛失英偉達(dá)HBM4 大單,韓系雙雄 SK 海力士、三星瓜分市場》

       原文標(biāo)題 : 趨勢丨HBM升級=HBF?高帶寬閃存如何破解AI算力的“內(nèi)存墻”

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權(quán)或其他問題,請聯(lián)系舉報。

發(fā)表評論

0條評論,0人參與

請輸入評論內(nèi)容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續(xù)

暫無評論

暫無評論

    人工智能 獵頭職位 更多
    掃碼關(guān)注公眾號
    OFweek人工智能網(wǎng)
    獲取更多精彩內(nèi)容
    文章糾錯
    x
    *文字標(biāo)題:
    *糾錯內(nèi)容:
    聯(lián)系郵箱:
    *驗 證 碼:

    粵公網(wǎng)安備 44030502002758號