CPU正面臨嚴(yán)重短缺
最開始緊缺的是GPU,隨后是內(nèi)存,而如今緊缺的矛頭轉(zhuǎn)向了CPU。據(jù)半導(dǎo)體行業(yè)分析機(jī)構(gòu)Semianalysis Dylan Patel指出,GPU已不再是云廠商的瓶頸,這一角色現(xiàn)已轉(zhuǎn)移至CPU。
受Agentic AI爆發(fā)式增長(zhǎng)影響
此前,用于AI的GPU僅執(zhí)行簡(jiǎn)單推理任務(wù),隨著新模型推出,任務(wù)形態(tài)發(fā)生根本性變化 —— Agentic AI如今被大量用于數(shù)據(jù)庫調(diào)用,以及物理仿真、模擬運(yùn)算等高度依賴CPU的任務(wù)。這些頻繁的數(shù)據(jù)庫訪問與CPU密集型運(yùn)算,導(dǎo)致云數(shù)據(jù)中心CPU使用率急劇飆升。
這種爆發(fā)式需求已導(dǎo)致GitHub等數(shù)據(jù)庫服務(wù)出現(xiàn)不穩(wěn)定,而造成這些情況的原因在于微軟將幾乎所有富余CPU資源全部外售:一部分用于內(nèi)部實(shí)驗(yàn)室,但更多是供給與OpenAI、Anthropic簽約的外部機(jī)構(gòu)。最終導(dǎo)致微軟幾乎無CPU可用,其他多家廠商也出現(xiàn)相同狀況。
以往配置通常是:少量CPU支撐大量GPU,例如100兆瓦GPU算力僅需1兆瓦甚至更少的CPU支撐。盡管GPU在AI云端服務(wù)器中仍占據(jù)主導(dǎo)地位(例如單機(jī)柜1個(gè)CPU搭配8個(gè)GPU),但如今這一配比差距正在大幅縮小,GPU與CPU在服務(wù)器中趨于接近1:1配比,無論是強(qiáng)化學(xué)習(xí)訓(xùn)練還是智能體推理均是如此。
三足鼎立之爭(zhēng)
盡管亞馬遜CPU服務(wù)器規(guī)模同比增至三倍,仍出現(xiàn)供應(yīng)耗盡,無法滿足未來新增需求;此外,隨著OpenAI從x86轉(zhuǎn)向Arm架構(gòu),Arm CPU受到的沖擊更為嚴(yán)重。云CPU短缺正倒逼各廠商大幅擴(kuò)產(chǎn)以應(yīng)對(duì)爆發(fā)式需求,一場(chǎng)圍繞三大架構(gòu)的三足鼎立之爭(zhēng)已然開始:
· 2021年,英偉達(dá)發(fā)布了首款數(shù)據(jù)中心CPU Grace,如今看來,這一決策極具先見之明。2026年2月,英偉達(dá)與Meta達(dá)成多年協(xié)議,其中包括首次大規(guī)模部署獨(dú)立運(yùn)行的Grace CPU,不與GPU搭配,而是單獨(dú)為Meta的個(gè)人智能體AI提供算力支撐。為了更優(yōu)的能效比,英偉達(dá)還選擇采用Arm架構(gòu),在數(shù)據(jù)中心向吉瓦級(jí)規(guī)模擴(kuò)張、電力成為核心制約因素的當(dāng)下,這一點(diǎn)至關(guān)重要。
· AMD成為CPU需求爆發(fā)的最大受益者,其采用小芯片架構(gòu)的EPYC「Turin」處理器產(chǎn)能供不應(yīng)求。“過去6至9個(gè)月,需求增幅前所未有。”AMD數(shù)據(jù)中心業(yè)務(wù)負(fù)責(zé)人福里斯特·諾羅德認(rèn)為,短期內(nèi)需求沒有任何放緩或停止的跡象。投行KeyBanc分析師則表示,AMD EPYC服務(wù)器CPU今年全年產(chǎn)能近乎售罄,高端EPYC處理器交期已拉長(zhǎng)至8-10周。
· 雖然英特爾服務(wù)器市場(chǎng)份額一直在持續(xù)被AMD蠶食,但x86生態(tài)在AI時(shí)代依然具備不可替代的價(jià)值,企業(yè)向智能體AI轉(zhuǎn)型并非從零開始,而是基于現(xiàn)有x86基礎(chǔ)設(shè)施演進(jìn)。這次CPU供應(yīng)緊張是始料未及的,英特爾此前承認(rèn)公司產(chǎn)能完全受限,2026年第一季度庫存將降至歷史最低水平;作為應(yīng)對(duì),英特爾已降低低端消費(fèi)級(jí)PC市場(chǎng)優(yōu)先級(jí),將晶圓產(chǎn)能轉(zhuǎn)向數(shù)據(jù)中心產(chǎn)品。
需要得注意的是,CPU產(chǎn)能也將全面向AI傾斜,這會(huì)直接導(dǎo)致面向消費(fèi)端、企業(yè)級(jí)的CPU生產(chǎn)線受擠壓,產(chǎn)能優(yōu)先供給AI領(lǐng)域。最終結(jié)果是:普通市場(chǎng)CPU供應(yīng)緊張、價(jià)格上漲,價(jià)高者得芯片。












評(píng)論