Claude 推出「Advisor Strategy」工具,讓輕量模型能動態呼叫 Opus 進行決策
Claude 推出「Advisor Strategy」工具,讓輕量模型能動態呼叫 Opus 進行決策,在降低成本的同時提升 Agent 效能。
Anthropic 近期於 Claude Platform 推出「Advisor Strategy」功能,旨在解決開發者在 AI Agent 效能與成本之間的權衡難題。透過將強大的 Opus 模型作為「顧問 (Advisor)」,輔助 Sonnet 或 Haiku 等較輕量模型作為「執行者 (Executor)」,開發者能以接近輕量模型的成本,獲得接近 Opus 等級的智慧表現。
核心運作機制
此策略顛覆了傳統「大模型編排、小模型執行」的子 Agent 模式。在「Advisor Strategy」中,由輕量模型主導整個任務流程,無需複雜的分解或編排邏輯:
- 執行者模型(Sonnet 或 Haiku)負責 End to End (端到端) 的任務執行,包括呼叫工具、讀取結果及迭代。
- 當執行者遇到難以解決的決策點時,會呼叫「Advisor」工具諮詢 Opus。
- Opus 存取共享上下文後,僅提供計畫、修正建議或停止訊號,不會直接呼叫工具或產生面向使用者的輸出。
- 整個過程在單次 API 請求中完成,無需額外的網路往返或上下文管理。
效能與成本效益
根據 Anthropic 的評測數據,此策略在多項基準測試中展現了顯著的性價比優勢:
- 在「SWE-bench Multilingual」測試中,Sonnet 搭配 Opus 顧問的得分比單獨使用 Sonnet 高出 2.7 個百分點,且每個任務的成本降低了 11.9%。
- 在「BrowseComp」測試中,Haiku 搭配 Opus 顧問的得分達到 41.2%,是其單獨使用時(19.7%)的兩倍以上。雖然成本高於單獨使用 Haiku,但遠低於單獨使用 Sonnet,且效能差距僅落後 Sonnet 29%,非常適合高流量且需平衡成本與智慧的任務。
技術整合與控制
該工具已於 Claude Platform 進入 Beta 階段,開發者可透過簡單的 API 設定啟用:
- API 整合:只需在 Messages API 請求中宣告
advisor_20260301,即可將其作為工具使用,與現有的網頁搜尋或程式碼執行工具並存。 - 成本控制:系統提供內建控制,開發者可設定
max_uses限制單次請求中的顧問呼叫次數。 - 計費模式:顧問產生的 token 依據顧問模型費率計費,執行者產生的 token 則依據執行者費率計費。由於顧問僅產生簡短計畫(通常為 400-700 個文字 token),整體成本遠低於全程使用 Opus。
業界回饋
早期使用者對此架構給予正面評價。Bolt 的執行長 Eric Simmons 指出,該策略在複雜任務上能做出更好的架構決策,且不會增加簡單任務的額外開銷。Genspark 的技術長 Kay Zhu 則表示,此工具在 Agent 轉向、工具呼叫及整體得分上均有明確改進,表現優於他們自行開發的規劃工具。Eve Legal 的機器學習工程師 Anuraj Pandey 更提到,在結構化文件提取任務中,此工具能讓 Haiku 4.5 動態擴展智慧,以 5 倍低的成本達到前沿模型的品質。
We're bringing the advisor strategy to the Claude Platform.
— Claude (@claudeai) April 9, 2026
Pair Opus as an advisor with Sonnet or Haiku as an executor, and get near Opus-level intelligence in your agents at a fraction of the cost. pic.twitter.com/fRkegyMs5t
Add the advisor tool to your Messages API call. When your Sonnet or Haiku agent hits a hard decision mid-run, it consults Opus, gets a plan, and continues, all within a single API request.
— Claude (@claudeai) April 9, 2026
In evals, Sonnet with an Opus advisor scored 2.7 percentage points higher on SWE-bench Multilingual than Sonnet alone, while costing 11.9% less per task. pic.twitter.com/pV4nftN1wz
— Claude (@claudeai) April 9, 2026
Now available in beta on the Claude Platform.
— Claude (@claudeai) April 9, 2026
Read more: https://t.co/FWbfVOKdaW
