Anthropic 推出 Managed Agents，透過解耦大腦與手部操作解決代理程式架構難題

Anthropic

@AnthropicAI

♥2,148🔁 244

𝕏 (Twitter)🔥🔥🔥🔥🔥2026年4月9日

📎 來源文章 ↗查看原文 ↗

AI 語音朗讀 · Edge TTS

AI 中文摘要Claude 生成

Anthropic 推出 Managed Agents，透過解耦大腦與手部操作解決代理程式架構難題。

Anthropic 近期推出 Managed Agents 託管服務，旨在解決長期運行 Agent 的架構挑戰。透過將「大腦」（Claude 與其執行框架 harness）與「手部」（沙盒與工具）進行解耦，該系統能適應未來不斷演進的 AI 模型與應用需求，並解決了長期以來「如何為尚未被構想出的程式設計系統」這一計算領域的經典難題。

架構演進的教訓
Anthropic 指出，執行框架 (harness) 往往隱含了對模型能力的假設，但隨著模型進步，這些假設容易過時。例如，先前 Claude Sonnet 4.5 曾出現「上下文焦慮」(context anxiety)，即因感知到視窗限制而過早結束任務，工程團隊為此加入了重置機制；然而，當同樣的 harness 用於 Claude Opus 4.5 時，該行為消失了，導致這些重置機制變成了冗餘的負擔。Managed Agents 的設計核心在於建立穩定的介面，確保其生命週期能超越任何特定的實作方式。

從「寵物」轉向「牲畜」
最初的設計將 session、harness 與沙盒全部耦合在單一容器中，這導致了基礎設施領域常見的「寵物與牲畜」(pets-vs-cattle) 問題：

容器變成了「寵物」：它是具名且需人工照護的個體，一旦失敗，session 就會遺失，且難以除錯。
耦合帶來的限制：由於 harness 假設所有工作都在同一個容器內完成，當客戶要求將 Claude 連接到虛擬私有雲 (VPC) 時，必須進行複雜的網路對接，這暴露了架構上的僵化。

解耦大腦與手部
為了改善上述問題，Anthropic 將系統拆解為三個獨立介面，使其能各自獨立失敗或被替換：

大腦（Claude 與 harness）：移出容器，將容器視為一種工具，透過 execute(name, input) → string 進行呼叫。
手部（沙盒與工具）：容器變成了「牲畜」，若失敗，harness 會捕捉錯誤並重新初始化，無需人工介入。
Session（事件日誌）：獨立於 harness 之外，確保即使 harness 崩潰，session 狀態仍能透過 wake(sessionId) 與 getSession(id) 恢復。

安全性邊界與權限管理
在耦合設計中，Claude 生成的程式碼與憑證位於同一容器，容易遭受提示詞注入攻擊。Managed Agents 採取了更嚴格的結構性修復：

憑證隔離：憑證從不進入沙盒，而是透過安全金庫 (vault) 管理。
代理機制：對於 Git 或自定義工具，透過專用代理 (proxy) 呼叫，該代理會從金庫獲取憑證，確保 harness 本身從未接觸過任何敏感憑證。

超越上下文視窗的記憶管理
針對長期任務超出 Claude 上下文視窗的問題，Anthropic 摒棄了不可逆的壓縮決策，改用 session 日誌作為外部上下文物件：

getEvents() 介面：允許大腦透過選取事件流的片段來查詢上下文。
靈活管理：harness 可以在將事件傳遞給 Claude 之前進行轉換或組織，以提高提示詞快取命中率，同時確保 session 紀錄的持久性與可查詢性。

效能與擴展性提升
解耦架構帶來了顯著的效能改進，特別是在首字延遲 (TTFT) 方面：

TTFT 改善：在舊架構中，每個 session 都需預先配置容器，導致高額的啟動成本。解耦後，容器僅在需要時才由大腦透過工具呼叫進行配置，使得 p50 TTFT 下降約 60%，p95 下降超過 90%。
擴展性：系統現在支援「多個大腦、多個手部」的模式，harness 不再關心沙盒是容器、手機還是模擬器，且大腦之間可以互相傳遞手部資源。

未來的系統設計哲學
Managed Agents 本質上是一個「元執行框架」(meta-harness)，它對 Claude 未來所需的具體 harness 不做預設，僅對圍繞 Claude 的介面（如狀態操作與計算執行）保持強硬立場。這種設計確保了系統能持續容納各種特定領域的 harness，並隨著 Claude 的智慧演進而保持穩定與可靠。

New on the Engineering Blog:

Building Managed Agents—our hosted service for long-running agents—meant solving an old problem in computing: how to design a system for “programs as yet unthought of.”

Read more: https://t.co/YYaEub2QGV
— Anthropic (@AnthropicAI) April 8, 2026

延伸閱讀

Anthropic 推出 Managed Agents