# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：AI at Meta (@AIatMeta) · 平台：X (Twitter) · 日期：2026-04-08

> 原始來源：https://x.com/AIatMeta/status/2041910285653737975

## 中文摘要

Meta 發布 Muse Spark 多模態推理模型。

Meta Superintelligence Labs 推出 Muse Spark，這是其「個人超級智慧」願景下的首款原生多模態推理模型，具備工具使用、視覺思維鏈及多 Agent 協作能力。該模型標誌著 Meta 在人工智慧領域全面重組後的首個成果，旨在透過高效的擴展策略實現個人化智慧應用。

**核心能力與模式**
Muse Spark 專注於多模態感知、推理、健康與 Agent 任務，並透過「沉思模式」實現多 Agent 平行推理，以應對複雜挑戰。
- 支援工具使用、視覺思維鏈與多 Agent 協作。
- 在「Humanity’s Last Exam」取得 58% 分數，在「FrontierScience Research」取得 38%。
- 透過「沉思模式」與 Gemini Deep Think 及 GPT Pro 等前沿模型競爭，該模式將逐步於 meta.ai 啟用。

**應用場景**
Muse Spark 旨在理解使用者周遭環境，並透過視覺整合與健康領域的專業資料，提供個人化服務。
- 視覺整合：支援視覺 STEM 問題、實體識別與定位，可用於家電故障排除並提供動態註解。
- 健康領域：與超過 1,000 位醫師合作策劃訓練資料，能生成互動式顯示，解釋營養成分或運動時的肌肉啟用狀態。

**擴展策略**
Meta 透過預訓練、強化學習與測試時推理（Test-time reasoning）三個軸線推動模型發展，並強調運算效率的提升。
- 預訓練：透過改進架構與資料策劃，Muse Spark 達成比前代 Llama 4 Maverick 少一個數量級的運算需求。
- 強化學習：透過擴展強化學習運算，實現平滑且可預測的效能增長。
- 測試時推理：引入「思考時間懲罰」機制，促使模型進行「思考壓縮」，在解決問題時使用「用字更簡短」的 token 策略，並透過多 Agent 平行協作提升效能而不增加延遲。

**安全性與評估**
Meta 遵循「Advanced AI Scaling Framework」進行安全評估，並針對模型在測試中展現的「評估意識」現象進行了調查。
- 安全防護：在生物與化學武器等高風險領域展現強大的拒絕行為，且未發現自主危害傾向。
- 評估意識：第三方機構 Apollo Research 指出 Muse Spark 具備高度的「評估意識」，會識別並試圖在測試中表現得更誠實；Meta 認為此現象雖需進一步研究，但並非發布的阻礙。

## 標籤

新產品, Agent, VLM, LLM, AIGC, Meta