- +1
HBF要火!AI浪潮的下一個(gè)贏家浮出水面:閃存堆疊成新趨勢(shì)
雖然三星的 HBM4 還沒(méi)有通過(guò)英偉達(dá)的驗(yàn)證,但就在上周五(9 月 19 日),三星的 12 層 HBM3E 終于通過(guò)了英偉達(dá)的測(cè)試認(rèn)證,也意味著即將成為英偉達(dá) GPU 的 HBM 供應(yīng)商之一。
一石激起千層浪。
AI 的火熱不只是讓人們爭(zhēng)相討論大模型和算力芯片,也徹底點(diǎn)燃了對(duì)內(nèi)存的需求。過(guò)去幾年,HBM(高帶寬內(nèi)存)成為了這場(chǎng)浪潮里最受追捧的「隱形明星」。沒(méi)有它,就沒(méi)有英偉達(dá) A100、H200 以及其他 AI 芯片的爆火,也也不會(huì)有無(wú)數(shù)大模型在短時(shí)間內(nèi)跑出來(lái)并且迅速迭代。
正因如此,HBM 供不應(yīng)求,幾乎成了半導(dǎo)體行業(yè)的「硬通貨」,也讓 HBM 主要廠商 SK 海力士一舉超越三星,成為全球最大存儲(chǔ)芯片制造商。
收入榜,圖片來(lái)源:TrendForce
但問(wèn)題隨之而來(lái),HBM 的速度沒(méi)問(wèn)題,帶寬夠快,延遲夠低,可容量依然有限,成本居高不下。AI 模型越大,對(duì)內(nèi)存的胃口越夸張,單靠 HBM 很難滿足未來(lái)幾年全球 AI 推理的龐大需求。尤其以 DeepSeek 為開(kāi)端,MoE 模型(專(zhuān)家混合模型)減小了對(duì)算力的要求,內(nèi)存墻的問(wèn)題變得更加突出。
而在本月早些時(shí)候,被稱(chēng)為「HBM 之父」的韓國(guó)科學(xué)與技術(shù)研究院教授金正浩表示,未來(lái)決定內(nèi)存行業(yè)勝負(fù)的將會(huì)是 HBF(High Bandwidth Flash,高帶寬閃存)。
這并非空穴來(lái)風(fēng)。作為 HBM 的最大玩家,SK 海力士已經(jīng)和閃存領(lǐng)域的代表閃迪走到了一起,公開(kāi)宣布聯(lián)合開(kāi)發(fā) HBF 技術(shù),并推動(dòng)行業(yè)標(biāo)準(zhǔn)化。但 HBF 到底是什么?當(dāng) HBM 不再夠用,HBF 能否成為下一個(gè)接力棒?
圖片來(lái)源:閃迪
內(nèi)存堆疊換閃存堆疊,HBF如何做到的?
在解釋 HBF 之前,先得把 HBM 擺在桌面上。HBM,全稱(chēng)高帶寬內(nèi)存,可以理解為「GPU 專(zhuān)用的豪華內(nèi)存」。它的特點(diǎn)是把多層 DRAM 芯片像「積木」一樣堆疊在一起,然后通過(guò)超寬的接口直接連到 GPU 上。這樣一來(lái),數(shù)據(jù)進(jìn)出的通道變寬了,傳輸速度自然暴漲。比如英偉達(dá) H200 搭載的 HBM3e,單卡內(nèi)存帶寬達(dá)到 4.8 TB/s,比普通 DDR 內(nèi)存快幾十倍。
問(wèn)題在于,HBM 像跑車(chē)一樣速度驚人,但油箱太小。它的容量往往停留在幾十 GB 級(jí)別,即便 SK 海力士即將量產(chǎn)的 HBM4 單殼最高也只能做到 36GB(未來(lái)可達(dá) 64GB),而大模型的參數(shù)動(dòng)輒上千億。更現(xiàn)實(shí)的問(wèn)題是,HBM 的成本極高,良率低、產(chǎn)能有限,直接導(dǎo)致一塊 GPU 動(dòng)輒數(shù)萬(wàn)美元,成為 AI 行業(yè)的瓶頸。
HBF(高帶寬閃存)正是在這種背景下備受關(guān)注。簡(jiǎn)單理解,HBF 就是把 NAND 閃存堆疊起來(lái),用類(lèi)似 HBM 的封裝方式,讓它既能像內(nèi)存一樣高速讀數(shù)據(jù),又能像硬盤(pán)一樣存更多內(nèi)容。它的目標(biāo)并不是完全取代 HBM,而是作為「容量補(bǔ)位」:
HBM 繼續(xù)承擔(dān)最關(guān)鍵、延遲最敏感的工作,而 HBF 則用來(lái)裝下超大模型的權(quán)重、KV Cache 等「吃容量」的部分。
HBF 結(jié)構(gòu)圖,圖片來(lái)源:閃迪
換句話說(shuō),HBM 是短跑冠軍,HBF 是長(zhǎng)途卡車(chē),兩者搭配,才能既快又大。這也是「HBM 之父」看好 HBF 的核心理由。
韓國(guó)科學(xué)技術(shù)院(KAIST)教授金正浩,被譽(yù)為「HBM 之父」,他正是當(dāng)年提出把內(nèi)存芯片豎著堆疊的關(guān)鍵人物。在 9 月初的演講中,他認(rèn)為內(nèi)存行業(yè)未來(lái)的勝負(fù)手將會(huì)是 HBF,邏輯并不復(fù)雜,AI 的趨勢(shì)已經(jīng)從算力中心轉(zhuǎn)向內(nèi)存為中心,算力的增長(zhǎng)再快,如果數(shù)據(jù)塞不進(jìn)去、模型放不下,都會(huì)卡住脖子。
而 HBF 剛好能補(bǔ)上 HBM 的容量短板,讓系統(tǒng)既保持高帶寬,又能擁有更大的可用空間和更低的成本。
這番話并不只是他的個(gè)人看法。在 8 月舉行的 FMS 未來(lái)存儲(chǔ)峰會(huì)上,閃迪透露了近兩年開(kāi)發(fā)的 HBF,并且宣布與 SK 海力士推動(dòng) HBF 的技術(shù)標(biāo)準(zhǔn)化。SK 海力士的優(yōu)勢(shì)在于封裝和堆疊工藝——這正是 HBM 成功的關(guān)鍵;閃迪則是 NAND 閃存領(lǐng)域的長(zhǎng)期玩家,擁有獨(dú)特的直鍵合工藝。
更關(guān)鍵的是,HBF 在設(shè)計(jì)之初就針對(duì) AI 推理的特點(diǎn):讀多寫(xiě)少、批量順序訪問(wèn)。AI 模型在推理時(shí),幾乎不改動(dòng)權(quán)重,主要是高速讀取;這讓 NAND 的「寫(xiě)入短板」不再是致命問(wèn)題,而它的高密度、低成本、穩(wěn)定性則被發(fā)揮到極致。
不斷拉長(zhǎng)的上下文長(zhǎng)度,也在吞噬存儲(chǔ),圖片來(lái)源:閃迪
因此,金正浩的判斷、SK 海力士的布局、閃迪的押注,其實(shí)都在指向一個(gè)共同邏輯:AI 的未來(lái)需要的不僅僅是更快的存儲(chǔ),還需要更大的存儲(chǔ)池。HBM 已經(jīng)把速度推到極致,但如果沒(méi)有 HBF,AI 的發(fā)展遲早會(huì)撞上天花板。
從這個(gè)角度看,HBF 不僅是一個(gè)新技術(shù)點(diǎn),更可能是整個(gè) AI 硬件架構(gòu)變革的核心動(dòng)力。
HBF徹底改變AI存儲(chǔ):從數(shù)據(jù)中心到消費(fèi)終端
HBF 的落地并不是遙不可及的未來(lái)。按照閃迪和 SK 海力士的路線規(guī)劃,2026 年下半年就會(huì)有首批 HBF 樣品出現(xiàn),2027 年初預(yù)計(jì)會(huì)有搭載 HBF 的 AI 推理設(shè)備面世。這意味著,它最快會(huì)在兩年內(nèi)走出實(shí)驗(yàn)室,成為真實(shí)的硬件產(chǎn)品。
那么,這些首批設(shè)備會(huì)是什么?最有可能的,是 GPU 廠商和服務(wù)器廠商率先嘗鮮。以英偉達(dá) H200 為例,是全球首款使用業(yè)內(nèi)最先進(jìn) HBM3e 顯存的 GPU,配備了 141 GB 的 HBM3e,成本極高。而 HBF 就像是為 GPU 接上了一個(gè)「外掛油箱」,不僅能讓更多模型一次性裝進(jìn)來(lái),還能大幅減少頻繁從 SSD 調(diào)數(shù)據(jù)的延遲。
但 HBF 的意義并不止于數(shù)據(jù)中心。在邊緣設(shè)備和個(gè)人計(jì)算領(lǐng)域,它同樣可能帶來(lái)巨大的改變。
今天我們看到 AI PC、AI 手機(jī)都在強(qiáng)調(diào)設(shè)備端運(yùn)行大模型,可現(xiàn)實(shí)是,終端設(shè)備的內(nèi)存遠(yuǎn)遠(yuǎn)不夠支撐上百億參數(shù)的模型。HBF 如果能以小型化模組、甚至與處理器一體封裝的方式進(jìn)入終端,就有機(jī)會(huì)讓用戶在本地調(diào)用更大的 AI 模型,帶來(lái)更流暢的語(yǔ)音助手、更聰明的生產(chǎn)力工具,甚至真正可離線運(yùn)行的 AI 應(yīng)用。
圖/微軟
更重要的是,HBF 的成本和功耗優(yōu)勢(shì),使它天然適合在終端場(chǎng)景擴(kuò)展。HBM 成本高昂、功耗居高不下,而 HBF 基于 NAND 閃存,密度更高,單位容量?jī)r(jià)格更低。對(duì)于筆記本電腦、智能手機(jī)甚至 XR 設(shè)備來(lái)說(shuō),如何在有限的空間和電池里提供更強(qiáng)的 AI 能力?HBF 給出了一個(gè)現(xiàn)實(shí)的答案:
在云端,它緩解 GPU 內(nèi)存瓶頸,讓超大模型能夠跑得更高效;在終端,它可能成為 AI 普及化的關(guān)鍵一步。
當(dāng)然,短期內(nèi)我們還很難看到 HBF 落地在邊緣終端或者個(gè)人計(jì)算平臺(tái)上,但通過(guò) AI 數(shù)據(jù)中心的大規(guī)模更新,HBF 仍然會(huì)在未來(lái)幾年改變 AI 的推理,進(jìn)而改變我們的 AI 體驗(yàn)。
寫(xiě)在最后
從 HBM 的爆發(fā),到 HBF 的登場(chǎng),我們其實(shí)看到的是同一個(gè)趨勢(shì):AI 已經(jīng)把內(nèi)存和存儲(chǔ)推到了舞臺(tái)中央。沒(méi)有 HBM,就沒(méi)有今天的算力繁榮;而如果沒(méi)有更大、更便宜、更低功耗的存儲(chǔ)介質(zhì),AI 的未來(lái)也可能被「卡脖子」。
HBF 之所以值得期待,不是因?yàn)樗嫒〈?HBM,而是它補(bǔ)上了一個(gè)關(guān)鍵缺口——容量。它讓 GPU 不再像背著小油箱的跑車(chē)那樣捉襟見(jiàn)肘,也給未來(lái)的 AI PC、邊緣計(jì)算帶來(lái)了想象空間。當(dāng)速度與容量形成合力,AI 的運(yùn)行方式很可能會(huì)被徹底改寫(xiě)。
但問(wèn)題也隨之而來(lái):
- HBF 真能像 HBM 一樣,從技術(shù)概念變成行業(yè)標(biāo)配嗎?
- 在數(shù)據(jù)中心率先落地之后,它能否順利走向個(gè)人計(jì)算終端?
- 當(dāng)存儲(chǔ)不再是瓶頸時(shí),下一個(gè)掣肘 AI 的環(huán)節(jié),又會(huì)是什么?
這些問(wèn)題的答案,或許要等到 2027 年 HBF 首批設(shè)備面世后才能揭曉。但可以肯定的是,定義 AI 的邊界,不只是算力,還在于儲(chǔ)存。而這場(chǎng)比賽,才剛剛開(kāi)始。
本文為澎湃號(hào)作者或機(jī)構(gòu)在澎湃新聞上傳并發(fā)布,僅代表該作者或機(jī)構(gòu)觀點(diǎn),不代表澎湃新聞的觀點(diǎn)或立場(chǎng),澎湃新聞僅提供信息發(fā)布平臺(tái)。申請(qǐng)澎湃號(hào)請(qǐng)用電腦訪問(wèn)http://renzheng.thepaper.cn。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營(yíng)許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




