久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > Meta推出自研AI芯片,專攻生成式AI推理任務

Meta推出自研AI芯片,專攻生成式AI推理任務

作者: 時間:2026-03-12 來源: 收藏

作為該系列芯片中最先進的型號, 在處理 MX8 格式數(shù)據(jù)時,性能可達 10 拍字節(jié)每秒(Petaflops),同時還支持效率更高的 MX4 數(shù)據(jù)格式。后者通過減少 AI 模型響應提示詞時需分析的字節(jié)數(shù)量,實現(xiàn)了處理速度的提升。MX 系列數(shù)據(jù)格式屬于微縮向量類型,MX4 格式以 3 位尾數(shù)共享 8 位指數(shù)的設計,在保證模型效果的前提下最大化壓縮數(shù)據(jù)量,是生成式 AI 的關鍵優(yōu)化技術之一。

采用四顆邏輯芯粒(Chiplet)執(zhí)行計算任務,芯粒周圍環(huán)繞著多堆疊高帶寬內(nèi)存(HBM),總存儲容量高達 516 吉字節(jié)(GB),是前代產(chǎn)品 MTIA 300 的兩倍。該處理器的核心組件還包括一顆系統(tǒng)級芯片(SoC)芯粒,負責與主機服務器進行信息傳輸,實現(xiàn)數(shù)據(jù)的雙向流轉。

預計將于 2027 年投產(chǎn),同期推出的還有性能稍低的同系列芯片 MTIA 450。這兩款處理器均針對生成式 AI 工作負載進行了專項優(yōu)化,內(nèi)置專用電路以加速流程中硬件密集型的關鍵環(huán)節(jié),例如閃存注意力機制(FlashAttention)—— 這是大型語言模型(LLM)分析輸入數(shù)據(jù)時采用的主流注意力機制實現(xiàn)方案,通過分塊計算、算子融合等創(chuàng)新設計,將傳統(tǒng)注意力機制的內(nèi)存復雜度從 O (N2) 降低至 O (N),大幅提升長文本處理效率。

工程師表示:“在系統(tǒng)層面,MTIA 400、450 和 500 共享相同的機架、機柜和網(wǎng)絡基礎設施。因此,新一代芯片可直接適配現(xiàn)有物理部署環(huán)境,加速從芯片研發(fā)到量產(chǎn)部署的轉化進程。我們采用的模塊化、可復用設計,還能最大限度減少多代芯片研發(fā)與部署所需的資源投入。” 這種統(tǒng)一架構設計讓 的數(shù)據(jù)中心無需大規(guī)模改造,即可實現(xiàn)芯片的無縫升級,降低了技術迭代的成本與風險。

為充分發(fā)揮 MTIA 芯片的性能潛力, 開發(fā)了定制化編譯器,用于對 AI 模型進行針對性優(yōu)化。另一款定制軟件模塊 ——“Hoot” 集體通信庫(Hoot Collective Communications Library),則負責管理處理器間的數(shù)據(jù)流轉。該庫采用近內(nèi)存計算架構,利用內(nèi)存單元附近的晶體管執(zhí)行特定計算任務,縮短了數(shù)據(jù)傳輸距離,進而提升了整體性能。這一設計貼合 AI 計算 “數(shù)據(jù)搬運耗時占比高” 的痛點,通過硬件與軟件的協(xié)同優(yōu)化,進一步釋放算力。

值得關注的是,此次自研芯片發(fā)布距 Meta 與英偉達達成數(shù)十億美元的處理器采購協(xié)議尚不足一個月。Meta 此舉旨在構建 “商用 GPU + 自研芯片” 的混合算力架構,既滿足自身快速增長的 AI 計算需求,又降低對單一供應商的依賴,形成多元化的供應鏈布局。


評論


相關推薦

技術專區(qū)

關閉