Arm AGI CPU:智能體式人工智能云時代的芯片基石
今日,Arm 正式發(fā)布Arm AGI CPU—— 這是一款基于 Arm Neoverse 平臺打造的全新量產(chǎn)級芯片,專為賦能下一代人工智能基礎(chǔ)設(shè)施而生。
在 Arm 逾 35 年的發(fā)展歷程中,這是我們首次推出自研芯片產(chǎn)品。此舉將 Arm Neoverse 平臺的能力從 IP 和 Arm 計算子系統(tǒng)(CSS)進一步拓展,為客戶部署 Arm 計算架構(gòu)提供了更多選擇:客戶既可自主研發(fā)定制化芯片,也可集成平臺級解決方案,或直接部署 Arm 設(shè)計的處理器。這一布局既順應(yīng)了人工智能基礎(chǔ)設(shè)施的快速演進趨勢,也滿足了生態(tài)伙伴對可快速規(guī)?;渴鸬?Arm 量產(chǎn)級平臺日益增長的需求。

如今,人工智能系統(tǒng)正逐步實現(xiàn)全球范圍內(nèi)的全天候持續(xù)運行。在過去,人類是計算流程中的瓶頸 —— 人與系統(tǒng)的交互效率,決定了業(yè)務(wù)在系統(tǒng)中的處理速度。而在智能體式人工智能時代,這一限制被徹底打破:軟件智能體可自主協(xié)調(diào)任務(wù)、對接多個人工智能模型,并做出實時決策。
隨著人工智能系統(tǒng)的持續(xù)運行與工作負(fù)載復(fù)雜度的不斷提升,CPU 已成為現(xiàn)代基礎(chǔ)設(shè)施的核心調(diào)度單元,肩負(fù)著保障分布式人工智能系統(tǒng)高效規(guī)?;\行的重任。在現(xiàn)代人工智能數(shù)據(jù)中心中,CPU 需管理數(shù)千項分布式任務(wù),包括協(xié)調(diào)加速器、管控內(nèi)存與存儲、調(diào)度工作負(fù)載、實現(xiàn)跨系統(tǒng)數(shù)據(jù)流轉(zhuǎn);而在智能體式人工智能場景下,CPU 還需統(tǒng)籌大量智能體的任務(wù)分發(fā)工作。
這一變革對 CPU 提出了全新要求,也推動了處理器技術(shù)的迭代升級。
Arm Neoverse 架構(gòu)已成為當(dāng)下眾多頂級超大規(guī)模云計算與人工智能平臺的技術(shù)基石,亞馬遜云科技 Graviton、谷歌 Axion、微軟 Azure Cobalt、英偉達(dá) Vera 均基于該架構(gòu)打造。隨著人工智能基礎(chǔ)設(shè)施向全球規(guī)?;卣梗鷳B(tài)伙伴紛紛期待 Arm 進一步發(fā)揮技術(shù)優(yōu)勢,而 Arm AGI CPU 正是為應(yīng)對這一行業(yè)變革而生。
Arm AGI CPU:為機柜級智能體式能效而生
智能體式人工智能工作負(fù)載要求芯片在海量規(guī)模下保持持續(xù)的高性能輸出。Arm AGI CPU 的設(shè)計初衷,便是在現(xiàn)代數(shù)據(jù)中心的功耗與散熱約束下,讓數(shù)千個計算核心并行運行時,仍能在持續(xù)負(fù)載下保持出色的單任務(wù)性能。
從運行頻率到內(nèi)存與輸入輸出架構(gòu),Arm AGI CPU 的每一處設(shè)計細(xì)節(jié),均為滿足高密機柜部署場景下,大規(guī)模并行、高性能的智能體式人工智能工作負(fù)載需求打造。
核心技術(shù)優(yōu)勢
? 智能響應(yīng)性能:最高 136 核 Arm Neoverse V3 處理器,每核心配備 2MB 專屬二級緩存,主頻最高可達(dá) 3.7GHz
? 面向可組合人工智能系統(tǒng)的輸入輸出能力:96 條 PCIe 6.0 通道,原生支持 CXL 3.0(可實現(xiàn)內(nèi)存擴展等功能),搭載 AMBA CHI 擴展鏈路
? 業(yè)界領(lǐng)先的 Arm 能效:基于先進 3 納米制程實現(xiàn)極致能效,最大化算力密度,熱設(shè)計功耗僅 300 瓦
? 雙芯粒設(shè)計:內(nèi)存與輸入輸出模塊集成于同一裸片,內(nèi)存延遲低于 100 納秒,內(nèi)存訪問經(jīng)延遲優(yōu)化設(shè)計
? 超高內(nèi)存性能:單核內(nèi)存帶寬 6GB/s,單芯片內(nèi)存容量最高 6TB,支持 DDR5-8800 規(guī)格,內(nèi)存架構(gòu)為計算場景專屬調(diào)優(yōu)
Arm 推出的參考服務(wù)器采用1OU 雙節(jié)點設(shè)計,每臺刀片服務(wù)器集成兩顆 Arm AGI CPU,均配備專屬內(nèi)存與輸入輸出模塊,總核心數(shù)達(dá) 272 核。該刀片服務(wù)器可滿配部署于標(biāo)準(zhǔn) 36 千瓦風(fēng)冷機柜,30 臺刀片服務(wù)器可實現(xiàn)總計8160 核的算力規(guī)模。此外,Arm 還與超微公司合作打造了 200 千瓦液冷機柜方案,可部署 336 顆 Arm AGI CPU,總核心數(shù)超 45000 核。
在上述配置下,Arm AGI CPU 的單機柜性能可達(dá)最新 x86 系統(tǒng)的 2 倍以上。這一優(yōu)勢源于 Arm 架構(gòu)的先天技術(shù)特性,以及系統(tǒng)資源與計算需求的精準(zhǔn)匹配,具體體現(xiàn)在三方面:
Arm AGI CPU 擁有業(yè)界領(lǐng)先的內(nèi)存帶寬,讓單機柜可支撐更多有效執(zhí)行線程;而 x86 CPU 在持續(xù)負(fù)載下,核心間的資源競爭會導(dǎo)致性能衰減;
Arm Neoverse V3 處理器的單核兼具高性能與高能效,相比傳統(tǒng)架構(gòu)表現(xiàn)更優(yōu),每條 Arm 線程可處理更多任務(wù);
更多的可用線程,疊加單線程更強的任務(wù)處理能力,共同造就了單機柜性能的大幅提升。
人工智能生態(tài)的早期積極反饋
Arm AGI CPU 已獲得人工智能生態(tài)前沿伙伴的高度認(rèn)可,商業(yè)落地進展顯著。合作伙伴的規(guī)劃部署場景涵蓋加速器管理、智能體式任務(wù)編排、智能體任務(wù)擴展所需的服務(wù) / 應(yīng)用 / 工具高密化,以及為人工智能數(shù)據(jù)中心打造的增強型網(wǎng)絡(luò)與數(shù)據(jù)平面計算能力。
** 元宇宙(Meta)** 是我們的核心合作方與首發(fā)客戶,雙方聯(lián)合研發(fā) Arm AGI CPU,旨在為 Meta 全系應(yīng)用的千兆瓦級基礎(chǔ)設(shè)施做性能優(yōu)化,并與 Meta 自研的 MTIA 加速器協(xié)同運行。其他首發(fā)合作伙伴包括思睿浦(Cerebras)、云焰(Cloudflare)、F5、OpenAI、正電子(Positron)、睿聯(lián)智控(Rebellions)、思愛普(SAP)以及韓國 SK 電訊。這些企業(yè)均與 Arm 展開深度合作,通過部署 Arm AGI CPU,加速云、網(wǎng)絡(luò)與企業(yè)環(huán)境中人工智能驅(qū)動型服務(wù)的落地。目前,華擎服務(wù)器、聯(lián)想、超微已開啟基于 Arm AGI CPU 的商用系統(tǒng)訂購。
為進一步加速產(chǎn)品落地,Arm 同步推出Arm AGI CPU 1OU 雙節(jié)點參考服務(wù)器,該產(chǎn)品采用開放計算項目(OCP)DC-MHS 標(biāo)準(zhǔn)形態(tài)。Arm 計劃將這款參考服務(wù)器的設(shè)計方案、配套固件進行開源貢獻(xiàn),同時還將開放系統(tǒng)架構(gòu)規(guī)范、調(diào)試框架,以及適用于所有 Arm 架構(gòu)系統(tǒng)的診斷與驗證工具,更多細(xì)節(jié)將在即將召開的 OCP 歐洲、中東和非洲峰會上公布。
Arm 基礎(chǔ)設(shè)施業(yè)務(wù)的全新篇章
Arm AGI CPU 的發(fā)布,標(biāo)志著 Arm 數(shù)據(jù)中心業(yè)務(wù)邁入全新發(fā)展階段,也彰顯了 Arm 在計算創(chuàng)新領(lǐng)域的持續(xù)領(lǐng)先地位。在人工智能重塑整個行業(yè)的當(dāng)下,Arm 始終致力于推動全生態(tài)的技術(shù)進步,為超大規(guī)模云服務(wù)商、人工智能初創(chuàng)企業(yè)等不同類型的客戶提供貼合需求的解決方案。
Arm AGI CPU 是 Arm 全新數(shù)據(jù)中心芯片產(chǎn)品線的首款產(chǎn)品,目前已開放訂購。Arm 已規(guī)劃后續(xù)產(chǎn)品研發(fā)路線,將持續(xù)追求業(yè)界領(lǐng)先的性能、擴展能力與能效表現(xiàn)。同時,該產(chǎn)品線將與 Arm Neoverse CSS 產(chǎn)品路線圖并行推進,確保所有 Arm 數(shù)據(jù)中心客戶在平臺架構(gòu)與軟件兼容性上實現(xiàn)同步發(fā)展。
邁入全新發(fā)展階段,Arm 的使命始終未變:打造算力基石,賦能各行業(yè)的創(chuàng)新發(fā)展。而 Arm 的這一愿景,也得到了全生態(tài)的鼎力支持:超 50 家來自超大規(guī)模計算、云計算、芯片、內(nèi)存、網(wǎng)絡(luò)、軟件、系統(tǒng)設(shè)計與制造領(lǐng)域的頭部企業(yè),正助力 Arm 計算平臺從 IP 向芯片產(chǎn)品拓展。憑借 Arm AGI CPU,我們不僅在定義原生人工智能數(shù)據(jù)中心的架構(gòu),更在親手打造這一全新基礎(chǔ)設(shè)施。
合作伙伴寄語:Arm AGI CPU 的落地價值
思睿浦(Cerebras)
思睿浦專注于打造超高速、大規(guī)模推理的人工智能基礎(chǔ)設(shè)施,而推理正成為人工智能領(lǐng)域的主流工作負(fù)載。在此背景下,可組合的高性能系統(tǒng)愈發(fā)重要 —— 這類系統(tǒng)既需要專為人工智能打造的加速芯片,也需要高效、可擴展的 CPU 來規(guī)模化協(xié)調(diào)數(shù)據(jù)流轉(zhuǎn)、網(wǎng)絡(luò)通信與任務(wù)調(diào)度。Arm 將計算平臺拓展至通用人工智能級基礎(chǔ)設(shè)施,對生態(tài)與全球規(guī)?;渴鹑斯ぶ悄艿目蛻舳?,都是一次積極的突破。
—— 安德魯?費爾德曼 思睿浦首席執(zhí)行官
云焰(Cloudflare)
云焰的使命是助力打造更優(yōu)質(zhì)的互聯(lián)網(wǎng),這要求我們的基礎(chǔ)設(shè)施能在全球網(wǎng)絡(luò)中實現(xiàn)高效擴展。Arm AGI CPU 提供的高性能、高能效算力,專為下一代工作負(fù)載打造,完美契合我們的需求。
—— 斯蒂芬妮?科恩 云焰首席戰(zhàn)略官
元宇宙(Meta)
在全球范圍內(nèi)提供人工智能體驗,需要一套強大、靈活的定制化芯片解決方案組合,這類芯片需為加速人工智能工作負(fù)載、優(yōu)化 Meta 全平臺性能量身打造。我們與 Arm 聯(lián)合研發(fā) Arm AGI CPU,旨在打造高效的計算平臺,大幅提升數(shù)據(jù)中心的性能密度,并為我們持續(xù)演進的人工智能系統(tǒng)提供跨代際的技術(shù)支撐。
—— 桑托什?賈納德漢 Meta 基礎(chǔ)設(shè)施部門負(fù)責(zé)人
OpenAI
OpenAI 運營著大規(guī)模的人工智能系統(tǒng),每天有數(shù)億用戶使用 ChatGPT,企業(yè)基于我們的 API 開展開發(fā),開發(fā)者依賴 Codex 等工具創(chuàng)新。隨著業(yè)務(wù)的規(guī)模化拓展,Arm AGI CPU 將成為我們基礎(chǔ)設(shè)施的重要組成部分,強化協(xié)調(diào)大規(guī)模人工智能工作負(fù)載的編排層能力,全面提升系統(tǒng)的能效、性能與帶寬。
—— 薩欽?卡蒂 OpenAI 工業(yè)計算部門負(fù)責(zé)人
正電子(Positron)
正電子專注于研發(fā)定制化推理加速器,可通過通用內(nèi)存實現(xiàn)突破性的令牌生成能效。Arm 始終能推出業(yè)界最具能效的計算平臺,這讓 Arm AGI CPU 成為下一代人工智能基礎(chǔ)設(shè)施的天然基石。將正電子的推理加速技術(shù),與高能效的 Arm AGI CPU 平臺相結(jié)合,我們有望助力數(shù)據(jù)中心運營商以更優(yōu)的每瓦性能、每美元性能,規(guī)?;渴鹎把厝斯ぶ悄苣P?。
—— 米泰什?阿格拉瓦爾 正電子人工智能首席執(zhí)行官
睿聯(lián)智控(Rebellions)
高性能人工智能系統(tǒng)需要通用計算與加速器架構(gòu)的緊密協(xié)同。通過將 Arm AGI CPU 與睿聯(lián)智控的神經(jīng)網(wǎng)絡(luò)處理器(NPU)集成于全新的高密服務(wù)器配置,我們正打造一款可擴展、高能效的平臺,為規(guī)模化人工智能推理工作負(fù)載做了專屬優(yōu)化。
—— 馬歇爾?蔡 睿聯(lián)智控首席商務(wù)官
思愛普(SAP)
思愛普已成功在基于 Arm 架構(gòu)的亞馬遜云科技 Graviton 平臺部署 SAP HANA,這充分印證了 Arm 生態(tài)在企業(yè)級工作負(fù)載場景下的成熟度與性能表現(xiàn)。Arm AGI CPU 進一步拓展了這一技術(shù)優(yōu)勢,其打造的可擴展、高效算力,將為下一代人工智能驅(qū)動的企業(yè)解決方案提供強力支撐。
—— 斯特凡?鮑爾勒 思愛普 HANA 與持久性技術(shù)部門高級副總裁兼負(fù)責(zé)人
韓國 SK 電訊
SK 電訊正布局大規(guī)模、全棧式人工智能推理數(shù)據(jù)中心基礎(chǔ)設(shè)施,其中便包含 Arm AGI CPU 與睿聯(lián)智控人工智能加速芯片。我們將自主研發(fā)的 A.X 大模型,與經(jīng)推理優(yōu)化的人工智能服務(wù)器相結(jié)合,既有望將該方案推向全球市場,也將大幅提升我們?nèi)斯ぶ悄軘?shù)據(jù)中心的行業(yè)競爭力。
—— 鄭錫根 SK 電訊首席技術(shù)官、人工智能創(chuàng)新中心負(fù)責(zé)人












評論