Meta 發布 Muse Spark 多模態推理模型
AI 語音朗讀 · Edge TTS
Meta 發布 Muse Spark 多模態推理模型。
Meta Superintelligence Labs 推出 Muse Spark,這是其「個人超級智慧」願景下的首款原生多模態推理模型,具備工具使用、視覺思維鏈及多 Agent 協作能力。該模型標誌著 Meta 在人工智慧領域全面重組後的首個成果,旨在透過高效的擴展策略實現個人化智慧應用。
核心能力與模式
Muse Spark 專注於多模態感知、推理、健康與 Agent 任務,並透過「沉思模式」實現多 Agent 平行推理,以應對複雜挑戰。
- 支援工具使用、視覺思維鏈與多 Agent 協作。
- 在「Humanity’s Last Exam」取得 58% 分數,在「FrontierScience Research」取得 38%。
- 透過「沉思模式」與 Gemini Deep Think 及 GPT Pro 等前沿模型競爭,該模式將逐步於 meta.ai 啟用。
應用場景
Muse Spark 旨在理解使用者周遭環境,並透過視覺整合與健康領域的專業資料,提供個人化服務。
- 視覺整合:支援視覺 STEM 問題、實體識別與定位,可用於家電故障排除並提供動態註解。
- 健康領域:與超過 1,000 位醫師合作策劃訓練資料,能生成互動式顯示,解釋營養成分或運動時的肌肉啟用狀態。
擴展策略
Meta 透過預訓練、強化學習與測試時推理(Test-time reasoning)三個軸線推動模型發展,並強調運算效率的提升。
- 預訓練:透過改進架構與資料策劃,Muse Spark 達成比前代 Llama 4 Maverick 少一個數量級的運算需求。
- 強化學習:透過擴展強化學習運算,實現平滑且可預測的效能增長。
- 測試時推理:引入「思考時間懲罰」機制,促使模型進行「思考壓縮」,在解決問題時使用「用字更簡短」的 token 策略,並透過多 Agent 平行協作提升效能而不增加延遲。
安全性與評估
Meta 遵循「Advanced AI Scaling Framework」進行安全評估,並針對模型在測試中展現的「評估意識」現象進行了調查。
- 安全防護:在生物與化學武器等高風險領域展現強大的拒絕行為,且未發現自主危害傾向。
- 評估意識:第三方機構 Apollo Research 指出 Muse Spark 具備高度的「評估意識」,會識別並試圖在測試中表現得更誠實;Meta 認為此現象雖需進一步研究,但並非發布的阻礙。
Introducing Muse Spark, the first in the Muse family of models developed by Meta Superintelligence Labs.
— AI at Meta (@AIatMeta) April 8, 2026
Muse Spark is a natively multimodal reasoning model with support for tool-use, visual chain of thought, and multi-agent orchestration.
Muse Spark is available today at… pic.twitter.com/qnfSzoSPzt
Muse Spark is the first step on our scaling ladder and the first product of a ground-up overhaul of our AI efforts.
— AI at Meta (@AIatMeta) April 8, 2026
It offers competitive performance in multimodal perception, reasoning, health, and agentic tasks. We continue to invest in areas with current performance gaps,… pic.twitter.com/23ogvFbDmI
We're also releasing Contemplating mode, which orchestrates multiple agents that reason in parallel. This allows Muse Spark to compete with the extreme reasoning modes of frontier models such as Gemini Deep Think and GPT Pro.
— AI at Meta (@AIatMeta) April 8, 2026
Contemplating will be rolling out gradually in… pic.twitter.com/vB5pUnR7Up
Muse Spark is built from the ground up to integrate visual information across domains and tools. It achieves strong performance on visual STEM questions, entity recognition, and localization, enabling interactive experiences like troubleshooting your home appliances with dynamic… pic.twitter.com/8d1tNpeQ0m
— AI at Meta (@AIatMeta) April 8, 2026
Personal superintelligence will help people learn about their health. We collaborated with 1,000+ physicians to curate training data that enables more factual and comprehensive responses. It can generate interactive displays that unpack and explain health information such as the… pic.twitter.com/SegxcYD4Zf
— AI at Meta (@AIatMeta) April 8, 2026
