久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 網(wǎng)絡(luò)與存儲 > 業(yè)界動態(tài) > Google AI壓縮技術(shù)引發(fā)市況反轉(zhuǎn)? 兩岸存儲器業(yè)界:大缺貨潮恐延續(xù)更久

Google AI壓縮技術(shù)引發(fā)市況反轉(zhuǎn)? 兩岸存儲器業(yè)界:大缺貨潮恐延續(xù)更久

作者: 時間:2026-03-30 來源: 收藏

AI爆發(fā),市場進(jìn)入「缺貨、漲價、搶產(chǎn)能」局面。 據(jù)估計,2026年服務(wù)器內(nèi)存需求將年增將超過40%,占整體儲存應(yīng)用比重超過50%,近日發(fā)表最新,引發(fā)市場擔(dān)憂內(nèi)存需求反轉(zhuǎn)疑慮。

盡管如此,臺灣、中國相關(guān)業(yè)界,多認(rèn)為無須擔(dān)憂,群聯(lián)電子執(zhí)行長潘健成直言,NAND Flash大缺貨將會延續(xù)更久。

大普微董事長楊亞非認(rèn)為,AI推理數(shù)據(jù)呈現(xiàn)指數(shù)級成長,國際大廠技術(shù)創(chuàng)新可能帶來局部缺貨緩解,但降低內(nèi)存的建置成本,反而將刺激更大應(yīng)用需求; 阿里云的千問大模型高級產(chǎn)品方案架構(gòu)師李彬也表示,壓縮內(nèi)存可能減少消耗,但大模型上下文推理的規(guī)模,仍飛速發(fā)展,對于整體儲存需求也快速成長。

長江存儲固態(tài)硬盤(SSD)事業(yè)部負(fù)責(zé)人譚弘則表示,AI上半場主要集中于訓(xùn)練,如同修煉內(nèi)功,通過大數(shù)據(jù)來為系統(tǒng)打基礎(chǔ); 但真正讓AI發(fā)揮作用關(guān)鍵在于推理側(cè),AI推理猶如招式,在多樣化應(yīng)用中猶如「拳、掌、腿」各種訓(xùn)練,將使用各種場景,讓終端達(dá)到最大價值。

他認(rèn)為,AI革命不僅存在于算力,大模型核心瓶頸在儲存,需要更大容量、更高性能的企業(yè)級SSD來支持巨量token吞吐。

近期業(yè)界關(guān)注發(fā)布最新「TurboQuant算法」,宣稱內(nèi)存數(shù)量只需原本6分之1, GPU系統(tǒng)進(jìn)行推理時,可將KV Cache資料進(jìn)行壓縮,就能運作大型語言模型(LLM)技術(shù),潘健成直指,外界認(rèn)為「未來主機不需要用太多SSD」的觀點,絕對是錯誤的。

假如壓縮技術(shù)不存在,主機需采用大量DRAM跟SSD,不僅成本貴、產(chǎn)業(yè)供給數(shù)量明顯不足,但未來如果主機的建置成本下降,出貨臺數(shù)將大幅增加。

潘健成舉例,如果汽車引擎成本要100萬美元,全世界路上跑的汽車也不會太多,但引擎變成2,000美元,汽車將會滿路跑。 因此未來主機出貨臺數(shù)快速增加,token也將大幅增加,這意味NAND Flash大缺貨會更久。

潘健成表示,NAND Flash從1月到3月的價格幾乎翻倍,近期原廠直接提出調(diào)漲50%,過了一個月后,又說下個月再漲25%,雖然各家模組廠手上握有低價庫存,營運獲利大幅成長,一旦庫存用完,進(jìn)入買貴、賣貴的時候?qū)⒚媾R更大壓力。

這意味著,內(nèi)存供應(yīng)鏈不能只靠賣價差,更需要投資技術(shù)、創(chuàng)造價值,2025年群聯(lián)整體研發(fā)投資費用大概4.4億美元,2026年估計7億~8億美元。

China Flash Market總經(jīng)理邰煒表示,AI讓儲存及記憶體進(jìn)入「史詩級」超級周期,徹底改寫產(chǎn)業(yè)結(jié)構(gòu),儲存已從一個BOM表的成本,變成AI競賽的戰(zhàn)略資源。 不過在經(jīng)歷2025年第4季~2026年第2季價格大幅上漲后,預(yù)計從第3季開始,NAND價格漲幅開始趨于穩(wěn)定。

邰煒進(jìn)一步指出,AI對儲存需求將與日俱增,由于大模型進(jìn)行推理時,需要把每一層、每個token的Key Value結(jié)果存起來,以避免重復(fù)計算,有效減少推理的時間。

但現(xiàn)在大模型正從短上下文,演變成長上下文,加上推理需求愈來愈多,KV快取的占用儲存空間,也會隨著token數(shù)量呈線性暴漲。

據(jù)估計,上下文從4K token漲到 128K token,token KV快取的存儲空間將會直接漲32倍,如果再遇到100個連帶詢問的請求,KV快取的需求就會達(dá)到TB級別,因此高帶寬內(nèi)存(HBM)是完全無法承載,這讓KV快取的需求大規(guī)模向NVMe SSD 轉(zhuǎn)移,并針對AI推理工作負(fù)載進(jìn)行優(yōu)化。

另一方面,近線(NL)HDD產(chǎn)能缺口龐大,QLC NAND的替代需求不斷上升,各種因素讓服務(wù)器儲存需求爆發(fā)式成長,但產(chǎn)能卻遠(yuǎn)遠(yuǎn)跟不上,因此存儲短缺將成常態(tài)。

邰煒認(rèn)為,雖然NAND原廠開始增加新一波資本開支及擴產(chǎn),但產(chǎn)能擴張的周期長達(dá)18~24個月,最早也要等到2027年,才有新產(chǎn)能釋放。

但就算是新增產(chǎn)能釋出,依然沒法完全滿足市場的需求,因此存儲供應(yīng)短缺的問題,短期內(nèi)將很難緩解。


評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉