RISC-V,伏擊AI Agent
今日,2026 玄鐵 RISC-V 生態大會召開,中電標協 RVEI 戰委會主任倪光南提到:「在物理 AI 時代,RISC-V 擁有模塊化、低功耗、定制化、安全性等優勢,能更好地滿足多樣化的算力需求。」
過去兩年,整個行業的注意力幾乎都被 GPU 吸走了。
只要談 AI,繞不開的就是 H100、B200,仿佛算力只剩下一種形態:大規模并行計算。這不難理解。大模型把計算需求高度集中在訓練和推理上,誰能提供更多并行算力,誰就更靠近 AI 時代的核心舞臺。于是,AI 幾乎被等同于 GPU。
相比之下,CPU 并沒有退場,只是退到了背景里。它依然重要,只是不再是最搶眼的角色。
變化是從 Agentic AI 開始顯現的。前不久,黃仁勛發表署名長文,談到未來軟件形態可能會被智能體重塑;幾天之后,英偉達又發布了 Vera CPU,并明確把它和 Agentic AI 放在一起講。連起來看,這兩個動作至少說明了一件事:當 AI 開始從「生成答案」走向「執行任務」,算力的重心也在悄悄變化。
也正是在這個時間點上,2026 玄鐵生態大會開了。會場上,達摩院一口氣端出了玄鐵 C950、Flex 可擴展平臺,以及新一輪生態動作。單看,這是一場 RISC-V 生態大會;但如果把它放回 Agent 這條主線里,它討論的其實是同一個問題:下一代智能系統,到底需要什么樣的 CPU,什么樣的架構。
大模型時代,GPU 站在臺前;到了 Agentic AI 時代,CPU 的重要性正在重新上升。而比 CPU 更值得重新估值的,可能是 CPU 背后的那套架構。
RISC-V,恰好撞上了這個時間點。
CPU,收復失地
很多人會疑惑,為什么 Agentic AI 時代,CPU 會重新崛起?因為,Agent 不是更長一點的聊天,而是更完整一點的軟件。
這一點,已經不只是概念。伯克利的 BFCL v4,已經把函數調用、工具調用放到 Agent 評測的中心;《TheAgentCompany》則把智能體扔進一個模擬軟件公司,讓它瀏覽網頁、寫代碼、運行程序和同事協作。結果并不輕松:最強基線 Agent 自主完成率也只在約四分之一這個量級。換句話說,Agent 真正難的,不是把一句話答出來,而是在復雜環境里把一件事做完。
這正是 CPU 重新變重要的原因。大模型時代,行業追求的是把訓練做大、把推理做快,因此 GPU 天然站在舞臺中央;但 Agent 時代,決定體驗的往往不是那段 token 生成,而是整條執行鏈:檢索、讀寫、調度、腳本執行、sandbox 拉起、數據庫訪問、狀態管理,以及反復重試和結果校驗。這些環節并不天然屬于 GPU 的主場。

來源:《A CPU-CENTRIC PERSPECTIVE ON AGENTIC AI》
Georgia Tech 與 Intel 一篇針對 Agent 系統的最新研究,對 Haystack RAG、Toolformer、ChemCrow、LangChain 和 SWE-Agent 五類代表性負載做了系統級剖析,結論是:CPU 側的工具處理,最多可以占到總延遲的 90.6%;在大批量場景下,CPU 動態能耗最高可占總動態能耗的 44%。說到底,GPU 決定模型會不會想,CPU 決定系統會不會干。
于是,問題也就變了。行業內思考的不只是 CPU 回來了,還在思考:什么樣的 CPU 架構,最適合 Agent?
傳統服務器時代,x86 的優勢幾乎沒有懸念;手機和 PC 時代,Arm 更占上風。但這是 AI Agent 時代。Agent 不是在舊軟件框架上做增強,而是在重寫軟件本身。它需要的,不是一顆放之四海而皆準的「標準品 CPU」,而是一套能夠圍繞具體場景快速生長、快速裁剪、快速擴展的底層架構。
這正是 RISC-V 的本質優勢。RISC-V 能夠迅速回答 Agent 時代最核心的三個問題:
首先,RISC-V 足夠靈活。云端智能體、邊緣機器人、端側助手,看上去都叫 Agent,但對時延、功耗、吞吐和安全的要求完全不是一回事。Agent 負載高度分化,底層架構必須可裁剪。
其次,RISC-V 足夠開放。AI 算法的演進速度是以月為單位的,RISC-V 開放的生態意味著,一旦新的算法需求出現,全球的開發者和芯片廠商可以迅速響應,推出定制化的硬件方案,而不必等待某家巨頭的排期。這種敏捷性,是封閉架構無法比擬的。
第三,RISC-V 天生強調開放互聯,更適合做系統整合。Agent 不是一個單點功能,而是一整套系統:前面要感知,中間要決策,后面還要調用、執行、校驗。很多時候,它不是靠一個計算單元單打獨斗,而是 CPU、NPU、DSP 和各種加速模塊一起配合。RISC-V 的開放和可擴展,決定了它在這種異構整合上更有空間,也更容易貼著場景去搭底座。
過去很多人看 RISC-V,總愛用昨天的尺子:它能不能立刻復制 x86?能不能馬上對標 Arm?能不能一夜之間擁有成熟生態?
AI Agent 時代給出的新問題是:誰更適合成為下一代智能軟件的底層載體?
在這個問題上,RISC-V 反而有一個過去少見的優勢:它沒有沉重的歷史包袱,卻有足夠大的可塑性;它不是在舊軟件時代和 x86、Arm 拼兼容存量,而是在新軟件時代爭奪增量。
這就是 RISC-V 最值得被重估的地方。
正如達摩院首席科學家孟建熠在大會現場所說:「行業需要協同創新、開放、有生態的架構,支撐起未來 Agentic AI 所帶來的新世界。」
玄鐵 C950,越過山脊
這次玄鐵生態大會上,最重磅的發布無疑是 C950。


RISC-V 已走過 15 個年頭,這幾年它在 MCU、嵌入式、家電、車載、存儲等領域快速鋪開。RISC-V 已正式占據全球處理器市場 25% 份額。按 SHD Group 的預測,到 2030 年全球 RISC-V SoC 出貨量將超過 162 億顆。換句話說,RISC-V 的問題從來不是不夠廣,而是還不夠高。
真正要從邊緣走向主流,RISC-V 遲早要打下高性能和 AI 計算。2024 年,RISC-V International 批準的 25 項標準里,超過一半已經與高性能或 AI 相關,這本身就說明,整個生態都在往這兩個方向集體抬升。

達摩院玄鐵,正是沿著這兩條線一路向上推進的代表。2019 年,阿里發布玄鐵 C910。今天回看,C910 最重要的意義,不只是當年的性能數字,而是它第一次讓行業相信:RISC-V 具備邁向高性能通用計算的可能。后來的如意 BOOK 甲辰版筆記本,以及法國云服務商 Scaleway 推出的全球首個 RISC-V 云實例,底座都選了 C910。某種意義上,C910 吹響了 RISC-V 沖擊高性能的號角。
服務器芯片,是檢驗一套架構性能成色最嚴格的考場。到 2025 年,達摩院推出 C930,性能達到 SPECint2006 15/GHz 左右,并在今年迭代中提升到約 17/GHz,第一次真正跨過了服務器級高性能 CPU 的門檻。
今年玄鐵生態大會上,達摩院把這條線繼續推高:新一代旗艦 CPU 玄鐵 C950。按大會披露,C950 在 SPECint2006 基準測試中突破70,單核性能超過22/GHz,最高主頻達到3.2GHz,成為目前性能最強的 RISC-V CPU。
把這個標準放到行業坐標里看,C950 已經可以對標 X86、Arm 最新一代面向云計算和機器學習場景的主力高性能核心。也就是說,C950 進入的,已經不是 RISC-V 內部比較,而是主流高性能 CPU 的核心戰場。
更關鍵的是,C950 不是一顆只會沖分的 CPU。在 MySQL、Redis、Nginx、OpenSSL 這些最典型的服務器工作負載下,C950 同樣跑出了行業第一梯隊的表現。這比跑分更有說服力,因為它說明,C950 在數據庫、緩存、Web 服務、密碼運算等真實系統場景中,已經具備了正面競爭力。
玄鐵在 C950 上加入了自研 Matrix 加速引擎,C950 已經能夠順利運行Qwen3 最強開源模型和 DeepSeek V3「滿血版」,輸出速度分別達到 34 Tokens/s 和 18 Tokens/s,首 Token 延遲分別為 3.4 秒和 1.7 秒。這也是 RISC-V CPU 第一次真正跑通千億參數級模型。再加上 C950 支持 RVA23.1 全部標配和可選擴展,進入服務器、AI、汽車等平臺,以及 Linux、Android 等系統環境的門檻也被進一步降低。
因此,C950 的出現對 RISC-V 行業至少有三重意義。
第一,它證明 RISC-V 開始真正進入高性能和 AI 計算的腹地。過去大家總說 RISC-V「有潛力」,但潛力這件事說久了,很容易變空。C950 的價值,在于它將這種潛力轉化為可驗證的產品能力。它不再只是向前試探,而是已經能夠與 Arm Neoverse V2、AMD Zen5、Intel GNR 這一類主流高性能核心放在一張桌子上討論。這對于 RISC-V 而言,不只是信心提升,更意味著技術路線獲得了更明確的產業確認。
第二,它給整個 RISC-V 高性能發展樹立了新的標桿。C910 讓行業看到高性能的可能,C930 讓 RISC-V 邁過服務器門檻,而 C950 則首次把「高性能旗艦產品」真正做了出來。過去兩年,RISC-V 在高性能方向持續推進,但始終缺少一顆足夠有代表性產品。C950 的出現,把全球 RISC-V 高性能的基準整體向上抬升了一檔。此后,無論國內還是海外,圍繞高性能 RISC-V 的競爭都很難再繞開這條新基線。
第三,它的前瞻性不只在于性能,而在于它是按 AI Agent 時代的 CPU 邏輯做出來的。AI Agent 時代所需要的,不只是傳統意義上的通用 CPU,也不只是單點 AI 加速器,而是一種既能承載復雜系統負載,又具備原生 AI 處理能力的新型 CPU。C950 的重要性,正在于它已經開始回應這一問題:面向未來 Agent,CPU 應當具備怎樣的能力結構。從這個角度看,C950 并不只是「今天最強」,更是在向下一代 CPU 的形態靠近。
放回玄鐵自身的路線圖中,這條演進線就更清晰了。C925、C930、C950,從 12 分、17 分到 22 分/GHz,玄鐵已經逐步鋪開了自己的高性能產品譜系。再加上此前的中低性能產品,玄鐵顯然要做的,不是一顆孤立的明星芯片,而是一整套覆蓋不同場景的 RISC-V 處理器矩陣。
Flex,RISC-V 的「外掛」
如果說 C950 解決的是一個問題:RISC-V 能不能做出高性能、能跑 AI 的旗艦 CPU。那么 Flex 回答的,其實是另一個更關鍵的問題:就算玄鐵做出來了,行業能不能跟著做出來。
這恰恰是 RISC-V 和 x86、Arm 最不一樣的地方。
在傳統架構里,客戶買到的往往是一個相對完整的標準答案;但 RISC-V 的價值,從來不只是「有一顆現成 CPU」,而是它允許用戶圍繞具體場景繼續往下做。AI、存儲、車載、工業控制,每個行業的負載都不一樣,真正能把 RISC-V 差異化拉開的,也不是通用部分,而是定制能力。
玄鐵這次發布 Flex,本質上就是把這種定制能力,從「各家自己摸索」變成「官方給一套臺階」。Flex 提供了處理器建模、開發環境和軟件工具鏈等整套框架,客戶既可以直接選用成熟的玄鐵 CPU IP,也可以基于 Flex 做自定義加速,打造更貼近垂直場景的處理器。Vector 加速、Matrix 加速等 AI 能力,客戶也可自行通過 Flex 平臺來實現。
Vector 解決通用向量計算,Matrix 往大模型推理再走一步。這樣一來,客戶不必從零起步,而是在一個已經跑通過模型、已經有工具鏈和軟件棧支撐的平臺上繼續做專用化。這也是 Flex 真正像「外掛」的地方。它不是替客戶把所有事情做完,而是先把最難的 80% 做掉。剩下那 20%,交給客戶結合自己的 Know-how 去完成。
玄鐵這幾年的策略其實越來越清楚:自己往上走,去啃高性能和 AI 這些最難的共性能力;合作伙伴往下沉,去吃具體行業、具體場景、具體產品。
2024 年,玄鐵推動成立無劍聯盟;到 2025 年大會上,無劍聯盟又吸納了西門子 EDA、網易有道、普華基礎軟件、經緯恒潤、南瑞瑞騰、Cadence 等新成員;2026 年,玄鐵生態大會又把國芯科技、Canonical、千問、天翼云、SGS 等真正拉到一張桌子上。RISC-V 生態的落地也在進一步推進,我們在現場了解到南芯 RISC-V 出貨量已經超過 1 億顆,未來三年電源品類有望做到 10 億美金。
C950 是在立標桿,Flex 是在搭臺子,無劍聯盟則是在把臺子變成產品。
中國開源,會師RISC-V 高性能
如果說玄鐵 C950 證明了 RISC-V 已經開始摸到高性能和 AI 計算的門檻,那么更值得注意的是,這件事已經不再只是單點突破,而是中國開源力量開始在 RISC-V 高性能生態上會師。
一端是標準。玄鐵已經在 RISC-V 基金會技術委員會及 10 多個技術小組擔任主席或副主席,持續參與高性能和 AI 相關標準推進;另一端是底層技術,北京開源芯片研究院披露,其「香山」高性能 RISC-V 路線已經形成從「南湖」到「昆明湖」的持續演進,并明確朝著服務器級高性能和虛擬化能力推進,未來玄鐵也會參與進來;再往下,則是軟件和應用生態的補齊,玄鐵積極投入 OpenRuyi 社區,patch 貢獻排名第一,并與中興等伙伴在服務器開源組件、存儲和編解碼優化上持續推進。這意味著,今天的 RISC-V 已經不只是某一顆芯片、某一家公司的故事,而是在標準、處理器、操作系統、基礎軟件和行業應用之間,慢慢形成一條完整鏈路。
過去很多年,RISC-V 更像一種開放的可能:靈活、可擴展、可定制,但離主流高性能計算,總像還隔著最后一道門。
Agentic AI 的到來,讓這件事第一次有了新的判斷標準。從這個角度看,2026 玄鐵生態大會真正重要的,不只是發布了一顆 C950,也不只是拿出了 Flex 和無劍聯盟,而是把一件事講得更具體了:
RISC-V 不是趕上了 Agentic AI。恰恰相反,Agentic AI 正在證明,RISC-V 才是更像下一代 CPU 的那套架構。


評論