Day-0支持｜摩爾線程完成智譜GLM-5.1極速適配，高效支撐長(zhǎng)程任務(wù)與代碼生成

作者：時(shí)間：2026-04-08 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

今日，摩爾線程在其旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上，成功實(shí)現(xiàn)了對(duì)智譜新一代旗艦?zāi)Ｐ?a class="contentlabel" href="http://www.cqxgywz.com/tech/s/k/GLM-5.1">GLM-5.1的Day-0極速適配，提供推理部署和訓(xùn)練復(fù)現(xiàn)全流程支持。

依托MUSA軟件棧強(qiáng)大的生態(tài)兼容性，摩爾線程技術(shù)團(tuán)隊(duì)基于高性能 SGLang-MUSA推理引擎及TileLang-MUSA算子編程語言，采用PD分離架構(gòu)完成深度調(diào)優(yōu)，在 MTT S5000 上實(shí)現(xiàn) GLM-5.1 的高效、高精度推理。這一成果彰顯了國(guó)產(chǎn)算力基礎(chǔ)設(shè)施對(duì)前沿 SOTA 模型的快速響應(yīng)能力，也為行業(yè)樹立了軟硬協(xié)同應(yīng)對(duì)復(fù)雜 AI 推理場(chǎng)景的新標(biāo)桿。

GLM-5.1是智譜迄今最智能的旗艦?zāi)Ｐ停彩悄壳叭蜃顝?qiáng)的開源模型。GLM-5.1大大提高了代碼能力，在最接近真實(shí)軟件開發(fā)的SWE-bench Pro基準(zhǔn)測(cè)試中超過GPT-5.4、Claude Opus 4.6，刷新全球最佳成績(jī)。值得一提的是，在模型整體性能大幅提升外，GLM-5.1還在長(zhǎng)程任務(wù)（Long Horizon Task）處理能力上實(shí)現(xiàn)了顯著突破。和當(dāng)前分鐘級(jí)交互的模型不同，GLM-5.1能夠在一次任務(wù)中獨(dú)立、持續(xù)工作超過8小時(shí)，期間自主規(guī)劃、執(zhí)行、自我進(jìn)化，最終交付完整的工程級(jí)成果。

針對(duì)GLM-5.1的長(zhǎng)程任務(wù)與代碼生成特性，摩爾線程基于自研MUSA架構(gòu)與SGLang-MUSA、TileLang-MUSA等關(guān)鍵技術(shù)，完成了系統(tǒng)性的算子適配與推理性能調(diào)優(yōu)。MTT S5000單卡AI算力（稠密）可達(dá)1000 TFLOPS，支持FP8到FP64全精度計(jì)算，其原生FP8加速顯著提升推理效率；結(jié)合高效KV Cache管理，有效支撐極長(zhǎng)上下文的顯存需求；同時(shí)，PD分離架構(gòu)進(jìn)一步解耦Prefill與Decode階段，降低長(zhǎng)序列生成中的干擾，保障持續(xù)任務(wù)的高吞吐與低延遲。此外，MTT S5000提供784GB/s的卡間互聯(lián)帶寬，為大規(guī)模部署帶來彈性擴(kuò)展能力。通過軟硬協(xié)同優(yōu)化，MTT S5000能夠穩(wěn)定承接GLM-5.1的長(zhǎng)程任務(wù)吞吐與工程級(jí)代碼推理表現(xiàn)。

從GLM-4.7到GLM-5.1，摩爾線程已連續(xù)實(shí)現(xiàn)發(fā)布當(dāng)日極速適配。這既體現(xiàn)了MUSA架構(gòu)對(duì)主流AI生態(tài)的深度兼容，更標(biāo)志著國(guó)產(chǎn)全功能GPU已具備大模型“從適配到部署”的全鏈路支撐能力。摩爾線程將持續(xù)夯實(shí)算力底座，助力開發(fā)者快速應(yīng)用前沿模型，共建更成熟的國(guó)產(chǎn)AI生態(tài)。

久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

Day-0支持｜摩爾線程完成智譜GLM-5.1極速適配，高效支撐長(zhǎng)程任務(wù)與代碼生成

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)