← 返回首頁

Anthropic 推出 Managed Agents,透過解耦大腦與手部操作解決代理程式架構難題

Anthropic
Anthropic
@AnthropicAI
2,148🔁 244
𝕏 (Twitter)🔥🔥🔥🔥🔥

AI 語音朗讀 · Edge TTS

AI 中文摘要Claude 生成

Anthropic 推出 Managed Agents,透過解耦大腦與手部操作解決代理程式架構難題。

Anthropic 近期推出 Managed Agents 託管服務,旨在解決長期運行 Agent 的架構挑戰。透過將「大腦」(Claude 與其執行框架 harness)與「手部」(沙盒與工具)進行解耦,該系統能適應未來不斷演進的 AI 模型與應用需求,並解決了長期以來「如何為尚未被構想出的程式設計系統」這一計算領域的經典難題。

架構演進的教訓
Anthropic 指出,執行框架 (harness) 往往隱含了對模型能力的假設,但隨著模型進步,這些假設容易過時。例如,先前 Claude Sonnet 4.5 曾出現「上下文焦慮」(context anxiety),即因感知到視窗限制而過早結束任務,工程團隊為此加入了重置機制;然而,當同樣的 harness 用於 Claude Opus 4.5 時,該行為消失了,導致這些重置機制變成了冗餘的負擔。Managed Agents 的設計核心在於建立穩定的介面,確保其生命週期能超越任何特定的實作方式。

從「寵物」轉向「牲畜」
最初的設計將 session、harness 與沙盒全部耦合在單一容器中,這導致了基礎設施領域常見的「寵物與牲畜」(pets-vs-cattle) 問題:

  • 容器變成了「寵物」:它是具名且需人工照護的個體,一旦失敗,session 就會遺失,且難以除錯。
  • 耦合帶來的限制:由於 harness 假設所有工作都在同一個容器內完成,當客戶要求將 Claude 連接到虛擬私有雲 (VPC) 時,必須進行複雜的網路對接,這暴露了架構上的僵化。

解耦大腦與手部
為了改善上述問題,Anthropic 將系統拆解為三個獨立介面,使其能各自獨立失敗或被替換:

  • 大腦(Claude 與 harness):移出容器,將容器視為一種工具,透過 execute(name, input) → string 進行呼叫。
  • 手部(沙盒與工具):容器變成了「牲畜」,若失敗,harness 會捕捉錯誤並重新初始化,無需人工介入。
  • Session(事件日誌):獨立於 harness 之外,確保即使 harness 崩潰,session 狀態仍能透過 wake(sessionId)getSession(id) 恢復。

安全性邊界與權限管理
在耦合設計中,Claude 生成的程式碼與憑證位於同一容器,容易遭受提示詞注入攻擊。Managed Agents 採取了更嚴格的結構性修復:

  • 憑證隔離:憑證從不進入沙盒,而是透過安全金庫 (vault) 管理。
  • 代理機制:對於 Git 或自定義工具,透過專用代理 (proxy) 呼叫,該代理會從金庫獲取憑證,確保 harness 本身從未接觸過任何敏感憑證。

超越上下文視窗的記憶管理
針對長期任務超出 Claude 上下文視窗的問題,Anthropic 摒棄了不可逆的壓縮決策,改用 session 日誌作為外部上下文物件:

  • getEvents() 介面:允許大腦透過選取事件流的片段來查詢上下文。
  • 靈活管理:harness 可以在將事件傳遞給 Claude 之前進行轉換或組織,以提高提示詞快取命中率,同時確保 session 紀錄的持久性與可查詢性。

效能與擴展性提升
解耦架構帶來了顯著的效能改進,特別是在首字延遲 (TTFT) 方面:

  • TTFT 改善:在舊架構中,每個 session 都需預先配置容器,導致高額的啟動成本。解耦後,容器僅在需要時才由大腦透過工具呼叫進行配置,使得 p50 TTFT 下降約 60%,p95 下降超過 90%。
  • 擴展性:系統現在支援「多個大腦、多個手部」的模式,harness 不再關心沙盒是容器、手機還是模擬器,且大腦之間可以互相傳遞手部資源。

未來的系統設計哲學
Managed Agents 本質上是一個「元執行框架」(meta-harness),它對 Claude 未來所需的具體 harness 不做預設,僅對圍繞 Claude 的介面(如狀態操作與計算執行)保持強硬立場。這種設計確保了系統能持續容納各種特定領域的 harness,並隨著 Claude 的智慧演進而保持穩定與可靠。