英特爾和SambaNova將Xeon 6定位為人工智能推斷目標
智能體 AI 正快速從實驗室走向實際部署,這迫使數據中心架構師重新思考如何處理推理工作負載。對此,英特爾與 SambaNova 系統公司推出了一款全新的異構架構,旨在支撐下一代人工智能應用。
兩家公司表示,該架構將 GPU、SambaNova RDU 與英特爾至強 6 處理器相結合,實現了性能、能效與兼容性的平衡。對于從事人工智能基礎設施工作的工程師與系統架構師而言,這一公告凸顯出未來推理系統有望擺脫僅依賴 GPU 的模式。
面向智能體 AI 的異構計算方案
全新架構針對新興的 “智能體 AI” 工作負載設計,這類系統能夠自主進行推理、規劃并執行復雜操作。這些工作負載在推理的不同階段,對計算資源有著不同的需求。
根據該架構方案:GPU 用于模型處理大尺寸提示詞的預填充階段;SambaNova 的可重構數據流單元(RDU)負責高吞吐量解碼運算;至強 6 處理器則作為主控與執行 CPU,統籌任務并運行應用邏輯。
這種分工體現了行業內日益明顯的趨勢:將 AI 推理的不同階段與最合適的硬件加速器匹配,而非單純依賴 GPU。兩家公司稱,該設計還能兼容支撐絕大多數數據中心環境的 x86 軟件棧。
依托 x86 生態系統
保持與現有基礎設施的兼容性是此次合作的核心。數據中心與企業級 AI 部署通常高度依賴基于 x86 的軟件與管理框架,因此集成能力成為新架構的重要考量。
英特爾公司數據中心事業部執行副總裁兼總經理 Kevork Kechichian 表示:“數據中心軟件生態建立在 x86 架構之上,并運行于至強處理器 —— 這為開發者、企業與云服務商提供了成熟可靠的規模化應用基礎。未來的工作負載需要多樣化的混合計算能力,此次與 SambaNova 的合作推出了一款高性價比、高性能的推理架構,能夠滿足客戶規模化需求,而這一切均由至強 6 驅動。”
這款聯合研發的平臺預計將于 2026 年下半年面向企業、云服務商與自主可控 AI 項目開放使用。















評論