久久ER99热精品一区二区-久久精品99国产精品日本-久久精品免费一区二区三区-久久综合九色综合欧美狠狠

新聞中心

EEPW首頁 > 智能計算 > 業界動態 > Meta推出Muse Spark多模態推理模型

Meta推出Muse Spark多模態推理模型

作者: 時間:2026-04-09 來源: 收藏

平臺公司今日推出了一款全新的,該模型在解答健康問題與分析數據方面表現極為出色。

未來幾周內, 將把該算法接入面向消費者的 AI人工智能服務中。此外,Meta 還將通過應用程序編程接口(API)向開發者開放 ,目前該 API 處于非公開預覽階段。

Meta 表示, 在多項基準測試中超越了 Claude 4.6 Opus、Gemini 3.1 Pro 與 GPT 5.4。其中一項測試為HealthBench Hard,用于評估 AI 模型解答醫學問題的能力,Muse Spark 較第二名 GPT 5.4得分高出 2% 以上。

該模型的優異表現部分得益于 Meta 在1000 余名醫生協助下構建的臨床訓練數據集。該數據集是 Meta 全面重構 AI 開發流程的成果之一。這家 Facebook 母公司稱,工程師還優化了模型架構與訓練后流程。

Meta 在今日的博客文章中表示:“實現同等能力所需的算力,較我們上一代模型 Llama 4 Maverick 減少了一個數量級以上。這一改進也讓 Muse Spark 的效率顯著優于當前可對比的主流基礎模型。”

Meta 稱,科學圖表分析是 Muse Spark 另一項領先競品的能力。在包含技術圖表的基準數據集CharXiv Reasoning上,該模型擊敗了 Opus 4.6 等對手。這種視覺推理能力可廣泛應用于其他場景:Meta AI 應用用戶可上傳超市貨架照片,讓模型估算每種食品的卡路里。

Meta 還在六項以上其他基準測試中對 Muse Spark 進行了驗證。在多數測試中,其得分與 Opus 4.6、Gemini 3.1 Pro、GPT 5.4 僅相差幾個百分點;在多項評估中,Muse Spark至少超越了其中一款競品模型。測試覆蓋代碼生成、機器人導航與工具使用等場景。

Muse Spark 可通過開啟名為 **“沉思模式”(Contemplating mode)的設置提升輸出質量。該功能會啟動多個 AI 智能體,將任務拆解為子步驟并并行執行。Meta 表示,該技術讓 Muse Spark 在 AI 領域最難的基準測試之一HLE** 上得分提升了約 8%。

Muse Spark 是 Meta 計劃推出的系列中的首款產品。Meta 在今日博客中稱:“我們正沿著一條可預測、高效率的擴展路線前進。在邁向個人超級智能的道路上,我們期待盡快推出能力更強的模型。”


評論


相關推薦

技術專區

關閉