英特爾和SambaNova將Xeon 6定位為人工智能推斷目標

作者：時間：2026-04-09 來源：

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

智能體 AI 正快速從實驗室走向實際部署，這迫使數據中心架構師重新思考如何處理推理工作負載。對此，英特爾與 SambaNova 系統公司推出了一款全新的異構架構，旨在支撐下一代人工智能應用。

兩家公司表示，該架構將 GPU、SambaNova RDU 與英特爾至強 6 處理器相結合，實現了性能、能效與兼容性的平衡。對于從事人工智能基礎設施工作的工程師與系統架構師而言，這一公告凸顯出未來推理系統有望擺脫僅依賴 GPU 的模式。

面向智能體 AI 的異構計算方案

全新架構針對新興的 “智能體 AI” 工作負載設計，這類系統能夠自主進行推理、規劃并執行復雜操作。這些工作負載在推理的不同階段，對計算資源有著不同的需求。

根據該架構方案：GPU 用于模型處理大尺寸提示詞的預填充階段；SambaNova 的可重構數據流單元（RDU）負責高吞吐量解碼運算；至強 6 處理器則作為主控與執行 CPU，統籌任務并運行應用邏輯。

這種分工體現了行業內日益明顯的趨勢：將 AI 推理的不同階段與最合適的硬件加速器匹配，而非單純依賴 GPU。兩家公司稱，該設計還能兼容支撐絕大多數數據中心環境的 x86 軟件棧。

依托 x86 生態系統

保持與現有基礎設施的兼容性是此次合作的核心。數據中心與企業級 AI 部署通常高度依賴基于 x86 的軟件與管理框架，因此集成能力成為新架構的重要考量。

英特爾公司數據中心事業部執行副總裁兼總經理 Kevork Kechichian 表示：“數據中心軟件生態建立在 x86 架構之上，并運行于至強處理器 —— 這為開發者、企業與云服務商提供了成熟可靠的規模化應用基礎。未來的工作負載需要多樣化的混合計算能力，此次與 SambaNova 的合作推出了一款高性價比、高性能的推理架構，能夠滿足客戶規模化需求，而這一切均由至強 6 驅動。”

這款聯合研發的平臺預計將于 2026 年下半年面向企業、云服務商與自主可控 AI 項目開放使用。