Meta推出Muse Spark多模態推理模型
Meta 平臺公司今日推出了一款全新的推理模型Muse Spark,該模型在解答健康問題與分析多模態數據方面表現極為出色。
未來幾周內,Meta 將把該算法接入面向消費者的Meta AI人工智能服務中。此外,Meta 還將通過應用程序編程接口(API)向開發者開放 Muse Spark,目前該 API 處于非公開預覽階段。
Meta 表示,Muse Spark 在多項基準測試中超越了 Claude 4.6 Opus、Gemini 3.1 Pro 與 GPT 5.4。其中一項測試為HealthBench Hard,用于評估 AI 模型解答醫學問題的能力,Muse Spark 較第二名 GPT 5.4得分高出 2% 以上。
該模型的優異表現部分得益于 Meta 在1000 余名醫生協助下構建的臨床訓練數據集。該數據集是 Meta 全面重構 AI 開發流程的成果之一。這家 Facebook 母公司稱,工程師還優化了模型架構與訓練后流程。
Meta 在今日的博客文章中表示:“實現同等能力所需的算力,較我們上一代模型 Llama 4 Maverick 減少了一個數量級以上。這一改進也讓 Muse Spark 的效率顯著優于當前可對比的主流基礎模型。”
Meta 稱,科學圖表分析是 Muse Spark 另一項領先競品的能力。在包含技術圖表的基準數據集CharXiv Reasoning上,該模型擊敗了 Opus 4.6 等對手。這種視覺推理能力可廣泛應用于其他場景:Meta AI 應用用戶可上傳超市貨架照片,讓模型估算每種食品的卡路里。
Meta 還在六項以上其他基準測試中對 Muse Spark 進行了驗證。在多數測試中,其得分與 Opus 4.6、Gemini 3.1 Pro、GPT 5.4 僅相差幾個百分點;在多項評估中,Muse Spark至少超越了其中一款競品模型。測試覆蓋代碼生成、機器人導航與工具使用等場景。
Muse Spark 可通過開啟名為 **“沉思模式”(Contemplating mode)的設置提升輸出質量。該功能會啟動多個 AI 智能體,將任務拆解為子步驟并并行執行。Meta 表示,該技術讓 Muse Spark 在 AI 領域最難的基準測試之一HLE** 上得分提升了約 8%。
Muse Spark 是 Meta 計劃推出的多模態推理模型系列中的首款產品。Meta 在今日博客中稱:“我們正沿著一條可預測、高效率的擴展路線前進。在邁向個人超級智能的道路上,我們期待盡快推出能力更強的模型。”






評論