# 策展 · X (Twitter) 🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Codez (@0xCodez) · 平台：X (Twitter) · 日期：2026-06-12

> 原始來源：https://x.com/0xCodez/status/2065089060104720776

## 中文摘要

# 使用 Fable 5 透過 14 個步驟建構自我改進的 Agent 系統：迴圈、動態工作流程、常規

大多數人使用 Claude Fable 5 的方式，就像把 Sonnet 4.6 當成擁有更大 context window 的模型一樣。他們輸入 Prompt，運作 5 分鐘，然後關閉分頁。

每 10 個使用者中，有 9 個從未執行過會「複合成長」的 Agent 系統——即每一次執行都能讓下一次執行變得更聰明、每一個狀態檔案（state file）都在累積、每一項 skill 都在精進。

Fable 5 是為了長時間運作而打造的，但你卻只用了幾分鐘。以下是建構 Fable 5 所設計的自我改進系統的 14 個步驟路線圖。

> 追蹤我的 Substack 以獲取最新的 AI alpha：movez.substack.com

Claude Fable 5 於 2026 年 6 月 9 日推出，這是第一個公開可用的 Mythos 等級模型，Anthropic 將其定位在 Opus 之上。

![Claude Mythos 5 / Fable 5 在多項基準測試（如 Agentic coding、Spatial reasoning 與 Cybersecurity 等）中，展現出優於 Claude Opus 4.8、GPT 5.5 及 Gemini 3.1 Pro 等模型的性能表現。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/190f7ca4077507a6.jpg)

<details class="chart-data"><summary>展開數據表</summary><table><thead><tr><th></th><th>Claude Mythos 5 / Fable 5</th><th>Claude Mythos Preview</th><th>Claude Opus 4.8</th><th>GPT 5.5</th><th>Gemini 3.1 Pro</th></tr></thead><tbody><tr><td>Agentic coding (SWE-Bench Pro)</td><td>80.3%</td><td>77.8%</td><td>69.2%</td><td>58.6%</td><td>54.2%</td></tr><tr><td>Agentic coding (FrontierCode (Diamond))</td><td>29.3% (xhigh)</td><td>-</td><td>13.4% (xhigh)</td><td>5.7% (xhigh)</td><td>-</td></tr><tr><td>Knowledge work (GDPval-AA)</td><td>1932</td><td>-</td><td>1890</td><td>1769</td><td>1314</td></tr><tr><td>Knowledge work vision (GDP.pdf)</td><td>29.8% (no tools)</td><td>-</td><td>22.5% (no tools)</td><td>24.9% (no tools)</td><td>16.7% (no tools)</td></tr><tr><td>Spatial reasoning (Blueprint-Bench 2)</td><td>38.6%</td><td>-</td><td>14.5%</td><td>36.2%</td><td>26.5%</td></tr><tr><td>Tool use (AutomationBench)</td><td>17.4%</td><td>-</td><td>15.5%</td><td>12.9%</td><td>9.6%</td></tr><tr><td>Computer use (OSWorld-Verified)</td><td>85.0%</td><td>85.4%</td><td>83.4%</td><td>78.7%</td><td>76.2%</td></tr><tr><td>Legal (Legal Agent Benchmark)</td><td>13.3%</td><td>-</td><td>10.4%</td><td>2.1%</td><td>0.0%</td></tr><tr><td>Multidisciplinary reasoning (Humanity's Last Exam - no tools)</td><td>59.0%*</td><td>56.8%</td><td>49.8%</td><td>41.4%</td><td>44.4%</td></tr><tr><td>Multidisciplinary reasoning (Humanity's Last Exam - with tools)</td><td>64.5%*</td><td>64.7%</td><td>57.9%</td><td>52.2%</td><td>51.4%</td></tr><tr><td>Biology (BioMysteryBench - hard)</td><td>46.1%*</td><td>29.6%</td><td>40.0%</td><td>-</td><td>-</td></tr><tr><td>Biology (BioMysteryBench - human solved)</td><td>83.9%*</td><td>82.6%</td><td>80.4%</td><td>-</td><td>-</td></tr><tr><td>Agentic coding (Terminal-Bench 2.1)</td><td>88.0%*</td><td>-</td><td>82.7%</td><td>83.4% (Codex CLI)</td><td>70.7% (Gemini CLI)</td></tr><tr><td>Cybersecurity (ExploitBench (Cap%))</td><td>78.0%*</td><td>69.0%</td><td>40.0%</td><td>34.0%</td><td>-</td></tr><tr><td>Health (HealthBench Professional)</td><td>66.0%*</td><td>64.7%</td><td>56.9%</td><td>51.8%</td><td>-</td></tr></tbody></table></details>

這是建構 Fable 5 所設計的自我改進系統的 14 個步驟路線圖，資料來源於 Anthropic 的工程部落格、團隊的公開實驗，並根據 2026 年 6 月的發布文件進行了驗證。

分為三個層級：Fable 5 實際解鎖的功能、使其產生複合成長的三個基礎（迴圈、動態工作流程、常規），以及將其轉變為系統的自我改進層。

![這是一張名為「The compound stack」的架構圖，展示了 AI 代理系統中四個層級的堆疊與運作邏輯。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/c4af9db006a06272.png)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片標題為「The compound stack」，並註明「Each layer feeds the next. Tomorrow's run inherits from yesterday's.」（每一層都為下一層提供養分。明天的運行繼承自昨天的成果。）

圖表由四個層級組成，右側箭頭標示「COMPOUNDS」，底部說明「Each layer below provides primitives; each layer above turns them into compounding behavior.」（下方的每一層提供基礎元件；上方的每一層將它們轉化為複合行為。）

各層級內容如下：
- LAYER 4 - SELF-IMPROVEMENT：Vision self-check、eval loops、rule distillation、lessons learned。說明：Agent grades own output, refines skills, writes general rules back to memory.
- LAYER 3 - MEMORY：State file、Skills、Knowledge Base、Lessons。說明：What the agent forgets, the repo remembers. Memory survives between sessions.
- LAYER 2 - ORCHESTRATION：/goal &amp; Outcomes、Dynamic Workflows、Routines。說明：Self-correction loops with independent grader sub-agents. Schedule, fire, iterate.
- LAYER 1 - PRIMITIVES：Fable 5、Sub-agents、Worktrees、Tools。說明：Mythos-class model. Days-long sessions. Parallel isolation. Real-world reach.</div></details>

14 個步驟，3 個層級。停止單純的 Prompting，開始建構一個會複合成長的系統。

---

第一部分 · Fable 5 實際解鎖的功能

## 01. Fable 5 是 Mythos 等級的模型。長時間的自主性是其核心賣點。

Claude Fable 5 於 2026 年 6 月 9 日發布，是第一個公開可用的 Mythos 等級模型——這是 Anthropic 在 Opus 之上引入的新層級。

![這是一張由 Anthropic 發布的「Fable 5」主題視覺圖，以多種蝴蝶拼湊成數字「5」的造型。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/d099cb9c96edb37a.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">畫面左側文字為「Fable 5」以及「by Anthropic」，左下角有 Anthropic 的品牌標誌。畫面右側由多種不同品種與顏色的蝴蝶排列組合成一個巨大的數字「5」。整體風格呈現自然科學插畫的質感，背景為米白色。</div></details>

Mythos Preview 於 4 月透過 Project Glasswing 提供給少數關鍵基礎設施合作夥伴；Fable 5 是 Anthropic 認為適合一般發布的版本，內建了安全分類器，會拒絕高風險領域的請求。

Mythos 5（不含這些分類器）仍僅限於 Glasswing 使用。

根據 Anthropic 的發布文件，Fable 5 實現了以往 Claude 模型無法維持的功能：

- **長時間的自主會話**：在 Claude Code 或 Claude Managed Agents (CMA) 等 Agent harness 中執行時，Fable 5 可以運作數天——跨階段進行規劃、委派任務給 sub-agent，並檢查自己的工作成果。

- **內建自我驗證**：編寫自己的測試來檢查工作成果。使用視覺能力對照目標檢查輸出。將經驗總結為通用規則。測試自己的假設。

- **最具野心的程式碼工作**：大型遷移、複雜實作、長達數天的自主程式撰寫會話。Anthropic 提出的主要使用案例是「交接大型專案並審查已完成的交付成果」。

- **多階段知識工作**：從深度研究與分析到準備好供審查的交付成果——只需極少的監督。

定價與其層級相符：每百萬輸入 token 10 美元，每百萬輸出 token 50 美元，並享有現有的 90% prompt caching 輸入 token 折扣。

可在 Claude API、AWS、Amazon Bedrock、Vertex AI、Microsoft Foundry 以及基於用量的 Enterprise 計畫中使用。這不是訂閱制模型，高用量會產生對應的帳單。

---

## 02. 自我改進不等於自我學習。

「自我改進的 Agent 系統」這個詞被隨意濫用。真實的版本與炒作的版本有很大的區別，在動手建構之前，理解這兩者的差距非常重要。

![這是一個名為「Dreaming」的 AI 代理記憶管理介面，展示了如何透過選擇記憶儲存庫與模型來處理對話紀錄。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/ca0ec4a1c3458867.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">畫面上方顯示標題「Dreaming」，副標題為「Review recent sessions to verify memory and surface new learnings.」。
下方有一個彈出視窗「Dream」，內容包含：
- 說明文字：「Dreaming reviews your agents' recent transcripts to organize existing memory and surface new learnings in a new memory store.」
- 下拉選單：Memory store（選擇為 support-agent-memory）、Model（選擇為 Opus 4.7）。
- Sessions 輸入區：提供「By date」與「By ID」選項，目前選定「By ID」，輸入框內填入「session_id1, session_id2, session_id3」。
- 按鈕：「Start dreaming」。

右側主列表顯示記憶儲存庫狀態：
- support-agent-memory (3ds4w5v)：Running，Token count 1.2k/2.4k，1m ago。
- workspace-knowledge (3ds4w5q2)：Running，Token count 800/1000，2h ago。
- user-preferences (3ds4w3x)：Running，Token count 1.2k/2.4k，2h ago。
- conversation-history (3xw4w3x)：Completed，Token count 1.2k/2.4k，2h ago。
- product-catalog (33es63w)：Completed，Token count 1.2k/2.4k，2 days ago。

右上角顯示狀態提示：「Dreaming started」。</div></details>

- **自我學習 (Self-learning)**：Agent 根據所學內容更新自己的權重。Fable 5 不會這樣做。目前沒有任何公開可用的模型能在生產環境中做到這一點。

遞迴自我改進 (Recursive self-improvement, RSI) 是 Anthropic 本身在 2026 年 5 月警告過的長期發展方向，而非今天發布的功能。

- **自我改進 (Self-improving)**：Agent 周圍的系統會產生複合成長。每一次會話都會將經驗寫入記憶。隨著邊緣案例（edge cases）的加入，skill 會變得更加精銳。

狀態檔案累積了已驗證的事實。評估迴圈（eval loops）優化了 Prompt 和評分標準。模型本身保持不變，但它運作的環境變得更敏銳。

從這個意義上說，自我改進是你所建構系統的一種屬性。Fable 5 具備原始能力——長 context、sub-agent 委派、視覺自我檢查、數天的耐力——這些能力將環境回饋迴圈轉變為真正能隨執行次數而複合成長的機制。

> Anthropic 的工程團隊直言：

「與其直接對 Fable 5 進行 Prompt 和引導，不如設計迴圈，讓模型根據環境回饋（例如 /goal 或 Outcomes）進行自我修正，並管理自己的 context（例如透過記憶）。」

---

## 03. 複合成長堆疊：四個層級，一個回饋迴圈。

本文頂部的圖 1 以一個圖表展示了架構。請由下往上閱讀——這是系統建構的順序，也是槓桿效應產生複合成長的順序。

- **第 1 層 · 基礎 (Primitives)**：Fable 5 本身、sub-agents、worktrees，以及 Agent 可使用的工具。這是目前大多數人使用的狀態，僅具備原始能力，周圍尚未形成系統。

- **第 2 層 · 編排 (Orchestration)**：用於自我修正迴圈的 /goal 和 Outcomes。用於複雜多步驟編排的動態工作流程。用於關閉筆電後雲端執行的常規。這將基礎轉變為工作流程。

- **第 3 層 · 記憶 (Memory)**：狀態檔案、Skills、知識庫、記錄下來的經驗。記憶是讓明天的會話能夠「恢復」而非「重新開始」的關鍵。

- **第 4 層 · 自我改進 (Self-improvement)**：視覺自我檢查、評估迴圈、規則提煉。Agent 評分自己的輸出，優化產生該輸出的 Skill，並將經驗寫回記憶。迴圈閉合。

這個架構之所以能複合成長，是因為第 1 層的每一個輸出都會向上流動至第 4 層，在那裡被評分、提煉並寫回第 3 層。明天的第 1 層執行將繼承昨天精進後的記憶與 Skill。模型本身是無狀態的，但它周圍的系統不是。

---

## 04. 何時使用 Fable 5、Opus 4.8 或 Sonnet 4.6？成本與能力矩陣。

Fable 5 的每個 token 成本約為 Opus 4.8 的 5 倍。自我改進系統中的每個步驟並不需要最高等級的模型。在生產環境中執行此系統的團隊會根據任務複雜度進行路由，而不是預設使用同一模型：

![在 FrontierCode 基準測試中，Claude Fable 5 的準確度隨著平均任務成本增加而顯著攀升，最高在約 $19 成本下達到 31.0% 的分數，表現明顯優於 Claude Opus 4.8 與 GPT-5.5。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/6e9ac369c58cf90a.jpg)

<details class="chart-data"><summary>展開數據表</summary><table><thead><tr><th></th><th>low</th><th>med</th><th>high</th><th>xhigh</th><th>max</th></tr></thead><tbody><tr><td>Claude Fable 5</td><td>(~$5.3, 11.5%)</td><td>(~$7.0, 17.8%)</td><td>(~$10.0, 24.0%)</td><td>(~$12.0, 29.5%)</td><td>(~$19.0, 31.0%)</td></tr><tr><td>Claude Opus 4.8</td><td>(~$3.3, 8.2%)</td><td>(~$4.2, 6.0%)</td><td>(~$4.8, 8.6%)</td><td>(~$8.0, 13.3%)</td><td>(~$10.5, 11.4%)</td></tr><tr><td>GPT-5.5</td><td>(~$1.8, 5.2%)</td><td>(~$3.8, 6.2%)</td><td>(~$5.0, 5.2%)</td><td>(~$6.2, 5.6%)</td><td></td></tr></tbody></table></details>

- **Fable 5 用於重型編排角色**：跨數天的規劃、委派給 sub-agents、使用視覺檢查工作成果、從累積的證據中提煉規則。

在「數天運作」的能力能抵銷其定價的地方使用 Fable 5。

- **Opus 4.8 用於編排者委派的困難但有邊界的子任務**：架構決策、複雜除錯、深度程式碼審查。同時也是 Fable 5 分類器封鎖任何請求時（網路安全、生物、化學、蒸餾）的明確備援。

- **Sonnet 4.6 用於高容量的工作者任務**：Lint 檢查、簡單重構、測試腳本、文件更新。大部分的展開（fan-out）工作都在此執行。

- **Haiku 4.5 用於評分 sub-agents 和低成本分類器**：獨立的 context window，低成本——非常適合 Anthropic 明確推薦的驗證者角色。

這是生產環境團隊所使用的、讓自我改進系統具備經濟效益的成本模式：編排者使用 Fable 5，工作者使用 Sonnet 4.6，評分者使用 Haiku 4.5，並在分類器封鎖時備援至 Opus 4.8。這也是 Anthropic 工程師內部使用的模式。

---

第二部分 · 三個基礎

## 05. /goal 與 Outcomes。同一概念的兩種實作。

Anthropic Claude Code 團隊為目標驅動的迴圈發布了兩個幾乎相同的基礎，每個 harness 各一個。

它們具有相同的形態：由獨立的評分者檢查工作，若未達標則開始下一次迭代，當評分者通過時迴圈結束。

實作上的細節差異決定了你該使用哪一個。

![這張表格比較了「Claude Code /goal」與「Claude Managed Agent Outcomes」兩種目標驅動循環（Goal-driven loops）的實作差異。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/802915b731775881.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">這是一張關於「目標驅動循環：兩種實作方式（Goal-driven loops: two implementations）」的比較表，詳細內容如下：

| 項目 | Claude Code /goal | Claude Managed Agent Outcomes |
| :--- | :--- | :--- |
| **Goal** | Measurable end state | Rubric with gradable criteria |
| **The judge** | Independent grader model (Haiku) | Independent grader sub-agent |
| **The loop** | Not-met verdict starts the next turn | Iterate → grade → revise |
| **Bound** | Turn / time clause in the condition | max_iterations |
| **Feedback** | Grader model feedback | Grader sub-agent feedback |
| **Exit** | Auto-clear on met or /goal clear | Rubric passes / interrupt |

畫面重點：此表格對比了兩種不同架構下，關於目標定義、評估機制（Judge）、循環邏輯、邊界條件（Bound）、反饋機制以及退出條件的技術實作差異。</div></details>

選擇規則很簡單：

- 當工作在你的機器上進行，且你想要一個快速、會話內的迴圈並具有可衡量的結束狀態時，請在 Claude Code 中使用 **/goal**。最適合動手寫程式、除錯不穩定的測試、優化單一檔案。純文字目標、模型評分者、終端機內回饋。

- 當工作需要在 Anthropic 託管的基礎設施上執行數小時或數天，且需要沙盒、GPU 或受控環境時，請在 CMA 中使用 **Outcomes**。最適合機器學習訓練、長時間執行的遷移、多天研究。基於檔案的評分標準、sub-agent 評分者、嚴格的 max_iterations 限制。

兩者都共享使其運作的結構性動作：編寫程式碼的 Agent 並非評分該程式碼的 Agent。我們將在第 6 步深入探討為何這很重要。

---

## 06. 驗證者 sub-agent 優於自我批判。

Anthropic 工程師 Prithvi Rajasekaran 在工程部落格上發表了一篇文章，指出模型很難對自己的輸出進行自我批判。Claude Code 團隊透過 Fable 5 實證證實了這一點：

> 「我們發現，驗證者 sub-agent 在 Fable 5 的表現上往往優於自我批判。」

這種機制是結構性的，與「是否更努力」無關。評估自己輸出的模型會看到自己的推理軌跡，並傾向於偏好與其已寫內容一致的結論。

評估相同輸出的獨立模型只會看到產出物和評分標準。驗證者與創作者之間沒有利益糾葛。

![在 20 次參數優化實驗中，Fable 5 的 val_bpb 表現顯著優於 Claude Opus 4.7，其最佳值達到 1.1604，而 Claude Opus 4.7 最佳值僅為 1.2178（此指標越低越好）。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/6670f645a00c8272.jpg)

<details class="chart-data"><summary>展開數據表</summary><table><tbody><tr><td>系列 · 起始值 · 最佳值 · 結束值</td></tr><tr><td>Fable 5 · 1.228 · 1.1604 · 1.1604</td></tr><tr><td>Claude Opus 4.7 · 1.228 · 1.2178 · 1.2178</td></tr></tbody></table></details>

除了標題數字外，圖表實際顯示了：

- Fable 5 進行了更大的結構性變更——TRAIN_SEQ_LEN=2048 train+eval (-0.0179)、重疊滑動視窗 eval (-0.0207)、int6 QAT + int6 expo (-0.0163)。每一項都是架構層級的動作，而非持續性的微調。

- Fable 5 克服了量化回歸並取得了最大勝利——它沒有在失敗的實驗後退縮，而是繼續進行調查。

- Opus 4.7 的第一個實驗 (QK_GAIN_INIT=5.0) 取得了小幅勝利。隨後幾乎所有的實驗都使用了相同的模板：調整一個純量、測量、如果為正則保留。這種形態更安全，但並未更好。

對系統設計的啟示：Fable 5 配合獨立驗證者可以探索更大的假設空間，並從負面的中間結果中恢復。沒有驗證者，同一個模型就沒有動力去超越第一個「足夠好」的結果。

---

## 07. 動態工作流程組合了自我修正模式。

動態工作流程於 2026 年 5 月 28 日在 Claude Code 中發布。

概念是：Claude 即時編寫自己的 JavaScript harness——一個包含 agent()、parallel() 和 pipeline() 基礎的檔案，加上處理資料流的標準 JS。這個 harness 是為該任務量身打造的，而非通用的。

對於使用 Fable 5 的自我改進系統，六種已記錄的動態工作流程模式中有三種值得採用：

- **展開並合成 (Fan-out-and-synthesize)**：將工作拆分為 N 個獨立部分，並行執行 Agent，然後合成結果。最適合每個步驟都能從乾淨的 context window 中受益的情況——例如，根據歷史範例評估 Skill 中的每一條規則。

- **對抗式驗證 (Adversarial verification)**：為每個創作者 Agent 產生一個獨立的驗證者，且該驗證者無法接觸創作者的推理過程。這是針對第 6 步中自我偏好偏差的結構性修正，按任務應用。

- **迴圈直到完成 (Loop until done)**：持續產生 Agent 直到滿足停止條件——沒有新發現、日誌中沒有更多錯誤、理論已驗證。搭配 /goal 設定嚴格的完成要求。

通常不會出現在自我改進系統中，但值得了解的兩種模式是：分類並執行（根據分類器將任務路由到正確的模型）和錦標賽（基於品味的兩兩比較排名）。前者對於模型路由（第 4 步）很有用。

後者在程式撰寫迴圈中很少見，但在設計或命名任務中很有用。

---

## 08. 用於並行安全的 Worktrees。數天的 Fable 5 會話，無檔案衝突。

當自我改進系統產生多個 Agent 時，檔案就會開始發生衝突。兩個 Agent 寫入同一個檔案，就像兩個工程師在沒有溝通的情況下提交到同一行程式碼一樣。

![此圖說明 Git Worktrees 的運作機制，展示如何從單一儲存庫（Repo）同時檢出多個分支到不同的工作目錄。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/bedf6edbeb7fe8b2.png)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片標題為「Git Worktrees」。圖中左側顯示一個名為「Repo」的儲存庫，透過虛線與實線箭頭連接至三個不同的工作目錄資料夾：
1. 「main branch」連接至「./main」資料夾，內部顯示藍色分支圖表，標記為「main」。
2. 「feature-a branch」連接至「./feature-a」資料夾，內部顯示綠色分支圖表，標記為「feature-a」。
3. 「feature-b branch」連接至「./feature-b」資料夾，內部顯示黃色分支圖表，標記為「feature-b」。
該圖解展示了 Git Worktrees 允許開發者在同一個儲存庫中，同時在不同的目錄下處理多個分支，而無需頻繁切換分支或執行 `git checkout`。</div></details>

Git worktree 解決了這個問題——在自己的分支上擁有一個獨立的工作目錄，共享相同的儲存庫歷史，因此一個 Agent 的編輯絕對無法觸及另一個 Agent 的 checkout。

對於 Fable 5 產生 sub-agents 來驗證或專業化的自我改進系統，worktrees 是不可或缺的：

- 創作者在 worktree A 中寫入。驗證者在 worktree B 中讀取（或針對 worktree A 的 checkout 進行唯讀檔案系統操作）。驗證者的探索不會觸及創作者的狀態。

- 並行結構實驗。如果 Fable 5 探索多種架構變更（如 Parameter Golf），每個實驗都在自己的 worktree 中執行。編排者收集所有結果；最好的結果會被合併。

- 帶有檢查點的數天執行。每個主要階段都可以是一個獨立的 worktree。失敗的階段不會污染其餘部分。

在 Claude Code 中，worktrees 有三種暴露方式：直接使用 git worktree、使用 --worktree 旗標在自己的 checkout 中開啟會話，以及在 sub-agents 上設定 isolation: worktree，讓每個輔助者都能獲得一個在會話結束後自動清理的全新 checkout。

---

## 09. 用於數天編排的常規 (Routines)。筆電關閉。Fable 5 運作中。

常規於 2026 年 4 月 14 日以研究預覽版發布。它們是已儲存的 Claude Code 設定——Prompt、儲存庫、連接器、權限——在觸發條件下於 Anthropic 管理的雲端基礎設施上執行。

你的筆電可以關閉，執行依然會進行。

![Claude Code 介面展示了設定自動化工作流程（Routine）的觸發條件與 API 整合設定。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/12252008cb323680.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">畫面顯示一個名為「Claude Code」的網頁應用程式介面，正在進行「New routine」（新例行程序）的設定。

主要內容轉錄：
- 名稱：pr-triage-bot
- 描述：When a pull request is opened against main, fetch the diff and the linked Linear is files (anything under /payments or /auth), check for missing tests, and post a thre hold the review and ping the author.
- 儲存庫：code/jared/space-tower
- 觸發器選項：Schedule (Runs on a recurring cron schedule)、GitHub event (Runs when a GitHub webhook event fires)、API (Trigger from your own code via the /fire endpoint)
- 連接器 (Connectors)：GitHub, Linear

彈出視窗「Add trigger」：
- 執行身分：jared@spacetowerdev.com
- 事件選項：PR opened (已選取), PR merged, Release published, Issue opened
- 說明：Fires only on Pull request: opened
- 篩選器：Add a filter condition

右側彈出視窗「Add trigger」：
- 狀態：Active
- 說明：Trigger this routine from external systems by sending a POST request to the URL below with your token.
- URL：https://hooks.routines.dev/r/pr-triage-b...
- Token：rt_live_8f2CwPMdFrA (提供 Regenerate 與刪除選項)
- 範例：Example curl

畫面重點：此介面展示了如何透過 GitHub 事件（如 PR 開啟）觸發自動化腳本，並整合 Linear 專案管理工具，同時提供了 API 端點供外部系統呼叫。</div></details>

對於 Fable 5 而言，常規是發揮模型能力的觸發層。Anthropic 在 Claude Managed Agents 上衡量 Fable 5 的「數天運作」能力——這是一個擁有完整工具且無本地機器限制的託管沙盒。

Parameter Golf 實驗在 8×H100 GPU 上執行了長達 8 小時。這種等級的執行無法在你的筆電上完成。

三種常規觸發類型，對應自我改進模式：

- **排程觸發 (Schedule triggers)**——早晨簡報模式。每天早上 7 點：重新執行昨天的評估套件，將任何新的失敗模式提煉為 Skills，並將摘要發布到 Slack。當你睡覺時，Agent 會變得更敏銳。

- **API 觸發 (API triggers)**——「事件觸發」模式。CI 失敗 → 觸發常規進行調查。Sentry 警報 → 觸發常規進行分流。自我改進系統會對你的真實環境做出反應，而不是固定的排程。

- **GitHub 事件觸發 (GitHub event triggers)**——「從真實工作中學習」模式。在 PR 開啟時，針對最新的 Skills 執行評估。在合併時，將 PR 引入的任何新模式寫回 Skill。儲存庫狀態與 Skill 狀態保持同步。

```python
> /schedule daily at 7am, use Fable 5 in CMA
  Goal: Re-run yesterday’s eval suite against the latest skills.
  Any test that newly passes → distill the pattern into the skill.
  Any test that newly fails → investigate, document in STATE.md.
  Post the digest to #engineering. /goal don’t stop until digest is
  posted and STATE.md is updated.

▲ Claude
  Creating routine: nightly-eval-compounding
  - model: claude-fable-5
  - harness: claude managed agent (sandbox)
  - trigger: schedule (0 7 * * *)
  - grader: independent Haiku sub-agent (Outcomes)
✓ Active. First run tomorrow 07:00 local. Skill set will compound.
```

---

第三部分 · 自我改進層

## 10. 5 階段記憶進程。

對於「Agent 記憶」在實踐中意味著什麼，最實用的框架來自 Anthropic 團隊的 Continual Learning Bench 1.0 實驗。有效使用記憶需要五個階段的進程。每個階段都是一個結構性動作；每個模型在進程的不同點退出。

- 1. **失敗 (Fail)**：Agent 犯錯並記錄失敗，細節足以供日後參考。

- 2. **調查 (Investigate)**：在繼續之前，Agent 找出失敗的原因。

- 3. **驗證 (Verify)**：Agent 將診斷結果轉變為已檢查的事實，而非猜測。

- 4. **提煉 (Distill)**：Agent 將驗證結果轉變為適用於特定案例之外的通用規則。

- 5. **諮詢 (Consult)**：在下一個任務中，Agent 讀取規則，而不是從頭重新推導事實。

![在資料庫探索任務中，配備記憶體儲存的 Fable 5 表現最佳，最終得分達 0.839，顯著優於 Opus 4.7（0.700）與 Sonnet 4.6（0.364），且所有模型在配備記憶體後的表現均優於其無狀態基準。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/602acc96ed32c018.jpg)

<details class="chart-data"><summary>展開數據表（1）(a) Final scores (±sd)</summary><table><thead><tr><th></th><th>Stateless baseline</th><th>With memory store</th></tr></thead><tbody><tr><td>Fable 5</td><td>0.555</td><td>0.839</td></tr><tr><td>Opus 4.7</td><td>0.383</td><td>0.700</td></tr><tr><td>Sonnet 4.6</td><td>0.330</td><td>0.364</td></tr></tbody></table></details><details class="chart-data"><summary>展開數據表（2）(b) Accumulation — curves converge to the (a) bars at q=30</summary><table><thead><tr><th></th><th>起始</th><th>結束</th></tr></thead><tbody><tr><td>Fable 5 - with memory store</td><td>~0.58</td><td>0.839</td></tr><tr><td>Opus 4.7 - with memory store</td><td>~0.47</td><td>0.700</td></tr><tr><td>Sonnet 4.6 - with memory store</td><td>~0.03</td><td>0.364</td></tr><tr><td>Fable 5 - paired stateless baseline</td><td>~0.52</td><td>0.555</td></tr><tr><td>Opus 4.7 - paired stateless baseline</td><td>~0.45</td><td>0.383</td></tr><tr><td>Sonnet 4.6 - paired stateless baseline</td><td>~0.25</td><td>0.330</td></tr></tbody></table></details>

在 Continual Learning Bench 的 SQL 探索任務中，各模型在提供記憶後的測量差異：

- Sonnet 4.6 在第 1 步退出。它的記憶儲存是一份失敗筆記和開放猜測的清單（「也許是 prc 而不是 prc_usd？」）。它很少諮詢先前的筆記。記憶存在，但不會複合成長。

- Opus 4.7 在第 3 步退出。它建立了一個標記不確定性的架構參考（「可能是美分計價的 prc？驗證。」）。驗證覆蓋率在 7–33%（中位數約 17%）的問題之間。

- Fable 5 傾向於完成整個進程。在最強的執行中，驗證覆蓋率達到 73%（30 個中的 22 個），並將學習成果提煉為有助於未來任務的通用規則。

## 11. 狀態檔案 (State file)。記憶實際存在的地方。

5 階段進程是心智模型。狀態檔案是模型寫入每個階段輸出的地方。對於在 Claude Managed Agents 中執行的 Fable 5，記憶是一個在會話之間持續存在的掛載檔案系統；在本地的 Claude Code 中，Markdown 檔案或 Linear 看板執行相同的工作。

真正支援 5 階段進程的狀態檔案結構：

```python
# Project memory · trading-platform

## Verified facts # stage 3 — stop guessing about these
- prc is in dollars, not cents. Verified via SELECT MIN(prc), MAX(prc) FROM trades.
- user_id matches auth_users.uid via JOIN, not auth_users.id. Confirmed 2026-06-09.
- Test database uses Stripe sandbox keys; production uses real keys via env.

## General rules # stage 4 — consult before re-deriving
- When querying time-bucketed metrics, always include timezone (default UTC mismatches).
- Auth middleware order matters: rate_limit -> jwt -> rbac. Reversing causes 401s.
- For migrations, never use ALTER on tables >1M rows without batching.

## Open failures (investigate next session) # stage 1 → 2
- 2026-06-09: tests/e2e/checkout flakes ~1 in 50 runs. Hypothesis: webhook race.
  Reproduction steps in debug/checkout-flake.md.

## Lessons learned # stage 4 distillations
- PowerShell hits TLS 1.2 issue on Windows CI runners. Always shell out to bash.
- Stripe webhook tests require STRIPE_WEBHOOK_SECRET. Skip with clear message if missing.

## Last session # stage 5 — resume, don’t restart
2026-06-10 03:30 UTC · 7 failures classified, 3 fixes drafted (claude/fix-*), 4 escalated.
Next: verify the auth middleware fix in claude/fix-rate-limit-order against production load.
```

該檔案有五個部分，對應五個階段。Verified facts 是第 3 階段的輸出——Agent 不再猜測的事項。General rules 是第 4 階段——提煉出適用於特定案例之外的規則。Open failures 是第 1-2 階段正在進行的工作。Lessons learned 是更多第 4 階段的輸出。

Last session 是第 5 階段的恢復指標。

決定此檔案是真正複合成長還是僅僅膨脹的兩個操作規則：

- **離開前寫入**：每個 Fable 5 會話結束時都會更新 STATE.md——嘗試了什麼、通過了什麼、失敗了什麼、保留了哪些新規則。如果會話沒有以寫入結束，下一個會話將從零開始。

- **會話開始時讀取**：每個新會話都從讀取 STATE.md 和最相關的 Skills 開始。Continual Learning Bench 的資料顯示，沒有這一點，即使是 Fable 5 也會表現出 Sonnet 等級的記憶行為。

---

## 12. 會複合成長的 Skills。將經驗寫入 Skill，而不僅僅是聊天記錄。

STATE.md 用於專案記憶。Skills 用於程序記憶——即「如何做這類事情」，應該適用於各個專案。

複合成長模式：在任何非瑣碎的失敗後，將經驗寫入 Skill 本身。每次系統執行，Skill 就會變得更精銳。

![此圖展示了 Anthropic 技能（Skills）目錄的結構與檔案內容範例，包含 YAML 元數據與 Markdown 格式的詳細說明。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/b6605b82e3a38ab4.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖表標題：What Skills look like
左側為「A Skill directory:」目錄結構範例：
anthropic_brand/
├── SKILL.md
├── docs.md
├── slide-decks.md
└── apply_template.py

右側為 `anthropic/brand_style/SKILL.md` 的檔案內容詳解：
1. YAML Fontmatter（元數據區）：
   - name: Anthropic Brand Style Guidelines
   - description: Applies Anthropic's official brand colors and typography to PowerPoint presentations

2. Markdown（自由內容區）：
   - ## Overview：說明此技能提供 Anthropic 官方品牌識別資源，包含簡報模板與應用工具。
   - ## Colors：列出主色調（Main Colors）及其十六進位代碼：
     - Dark: `#141413` - Primary text and dark backgrounds
     - Light: `#faf9f5` - Light backgrounds and text on dark
     - Light Gray: `#e8e6dc` - Subtle backgrounds
   - ### Typography：列出字體規範：
     - Headings: Poppins (with Arial fallback)
     - Body Text: Lora (with Georgia fallback)

畫面重點：此圖說明了如何透過結構化的目錄與 Markdown 檔案來定義與組織 AI 代理（Agent）可使用的技能，將元數據與具體內容分離，便於系統讀取與執行。</div></details>

一個已經複合成長兩週的 Skill 與一個全新的 Skill 看起來不同。出現了新的部分：已知的失敗模式、事後檢討得出的規則、在生產環境中觀察到的反模式（anti-patterns）。

Skill 不再是一組靜態指令；它是團隊實際學到內容的累積記錄。

```python
---
name: ci-triage
description: Classify CI failures, draft fixes for easy ones, escalate the rest.
  Trigger on workflow_run.failure or on the morning triage routine.
---

# CI triage skill

## Classification rules
- env: missing secret, wrong env var. # escalate to human, never auto-fix
- flake: passes on retry without code change. # retry once, then file
- bug: deterministic failure tied to recent commit. # draft fix
- dependency: tied to version bump. # draft rollback
- infra: timeout, OOM, runner issue. # escalate

## Known failure modes # added by the loop over 14 days
- webhook-race: e2e checkout flakes when Stripe webhook arrives mid-test.
  Fix: add 2s settle delay in tests/utils/webhook.ts.
- tls-handshake: Windows runners fail TLS 1.2 in PowerShell. Use bash.
- db-migration: ALTER on trades table >1M rows times out at 30s. Batch in 10k chunks.

## Anti-patterns (do NOT do) # added after real incidents
- Never disable a failing test to make CI green. File it instead.
- Never modify .github/workflows/ without human approval.
- Never touch src/payments/ or src/billing/ without security review.

## State
Update STATE.md after each run with classifications, fixes drafted, escalations.

## Eval suite # step 13 — the loop verifies the skill
Run against eval/ci-triage-cases.jsonl weekly. Any newly-failing case →
add to known failure modes after Outcomes verifier confirms.
```

複合成長合約：每個已確認的經驗都進入 Skill，而不僅僅是 STATE.md。STATE.md 是專案範圍的，隨專案結束而消失。Skills 存在於 ~/.claude/skills/ 中，並隨你移動。

兩週的紀律性寫作所產生的 Skill，在實質上會優於 Fable 5 在新專案中從零開始推導出的任何結果。

---

## 13. 透過視覺進行自我驗證。Fable 5 對照目標檢查自己的 UI。

Anthropic 隨 Fable 5 發布的核心能力之一是「使用視覺對照目標檢查輸出」。這聽起來很抽象，直到你看到它實際取代了什麼：人類盯著螢幕截圖確認 UI 看起來是否正確。

Fable 5 在宣告完成前，會在迴圈中自行執行該步驟。

生產環境中的模式：

- 創作者 sub-agent 編寫 UI 程式碼。將結果渲染為螢幕截圖。

- 驗證者 sub-agent 使用視覺讀取螢幕截圖，將其與目標描述、專案 Skill 中的設計 token 以及 STATE.md 中的先前螢幕截圖進行比較。

- 判決結果回到迴圈。匹配 → 標記任務完成。不匹配 → 描述差距，並將結構化 diff 交回給創作者。

這是 Anthropic 在 Parameter Golf 實驗中於相同 harness 下測量的模式：Fable 5 查看訓練圖表（視覺產出物）並決定曲線是否符合標準。

沒有人類在迴圈中閱讀圖表，驗證者閱讀了圖表。

---

## 14. Mythos 安全邊界。Fable 5 不會做什麼，以及如何繞過它進行設計。

最後一步是第一天最容易跳過，也是最難以透過慘痛教訓學到的步驟。

Fable 5 內建安全分類器，會拒絕在特定的高風險領域（網路安全漏洞研究、生物、化學和模型蒸餾）進行回應。在這些領域，Anthropic 會自動將 Fable 5 備援至 Claude Opus 4.8。這是已記錄的文件，不是 bug。

對於自主運行的自我改進系統，這意味著：

- 如果你的系統涉及安全工具（SAST 掃描、漏洞研究、滲透測試邏輯，甚至某些類別的程式碼審查），請預期會遇到分類器封鎖。為備援進行架構設計：明確將這些任務路由至 Opus 4.8，或將封鎖情況呈現給人類審查員。

- 生物、化學和蒸餾領域也是如此。分類器範圍很廣。科學計算工作流程可能會觸發它；加密原語的程式碼審查也可能會觸發它。

- 設計你的 Skills 以優雅地處理備援。Skill 應該知道它產生的哪些任務可能會觸發分類器，並記錄預期的行為。一個在分類器封鎖時靜默失敗的迴圈，看起來與在真實錯誤中失敗的迴圈完全相同——直到你進行除錯。

- 審查系統卡 (System card)。Fable 5 的 319 頁系統卡記錄了分類器的範圍。這次發布在 2026 年 6 月中旬引發了爭議，因為文件中隱藏了一些降級行為。在部署到生產環境之前請閱讀它。

一般設計原則：將安全邊界視為已知的備援，而非失敗模式。一個明確處理邊界的自我改進系統，在分類器進化時依然穩健。忽略它的系統在 Anthropic 更新政策時會產生靜默回歸。

---

## § 讓 Fable 5 僅發揮 10% 潛力的錯誤

- **像 Sonnet 4.6 一樣使用 Fable 5，只是 context 更大**：5 分鐘的 Prompt-and-close 會話浪費了 Mythos 等級的定價，且沒有複合成長效果。

- **自我批判而不是獨立驗證者**：創作者給自己的作業評分。Anthropic 測量了差異；團隊明確記錄了驗證者 sub-agent 模式。

- **沒有 STATE.md**：每個會話都從零開始。Continual Learning Bench 的資料顯示，Fable 5 超過 70% 的記憶優勢在這裡消失。

- **從未寫入的 Skills**：靜態 Skill 是可以的；一個在真實失敗後沒有累積經驗的 Skill 是浪費的腳手架。

- **在 Sonnet 4.6 可以處理的任務上使用 Fable 5**：文件更新、簡單重構、Lint 修正。按複雜度路由；將 Fable 5 保留給編排者角色。

- **在筆電上執行長時間會話**：數天運作能力需要雲端基礎設施（CMA 或 Routines）。關閉筆電會終止會話。

- **忽略 Mythos 安全邊界**：網路/生物/化學領域的分類器封鎖會產生靜默回歸。明確為備援進行架構設計。

- **視覺任務沒有視覺驗證**：UI、儀表板、設計保真度——僅使用純文字驗證者檢查這些內容，會錯過重要的失敗模式。

- **跳過 /goal 或 Outcomes**：沒有由獨立評分者檢查的客觀停止條件，迴圈會停在「處理得差不多」而不是「完成」。

- **沒有保留政策審查**：未經檢查 30 天/2 年條款的情況下，透過 Fable 5 常規傳輸敏感資料會靜默產生合規問題。

---

## 結論：

Fable 5 不是一個更快的聊天工具，它是產生複合成長系統的基質。

第一個公開可用的 Mythos 等級模型並不是為了被更快地 Prompt 而發布的，它是為了成為你圍繞其建構的自我改進系統的編排者。

能力標題——數天會話、sub-agent 委派、視覺自我檢查、累積記憶——只有在模型周圍的系統發揮作用時，才值得其定價。

Anthropic 團隊自己的實驗讓差距變得可見。Parameter Golf：配備獨立驗證者的 Fable 5 探索了更大的架構變更，並克服了負面的中間結果，取得了比 Opus 4.7 多約 6 倍的改進。

Continual Learning Bench：配備記憶的 Fable 5 以 73% 的驗證覆蓋率完成了完整的 5 階段進程，而 Opus 4.7 僅為 17%。模型在每次比較的兩半中都是相同的，改變的是它周圍的系統。

挑選一個你還沒做的複合成長堆疊層——可能是驗證者 sub-agent（第 6 步）、狀態檔案（第 11 步）或視覺驗證（第 13 步）——明天就加上它。然後再做下一個。

自我改進是系統的屬性，而不是模型的屬性。建構系統吧。

## 標籤

Agent, 教學資源, Skills, Claude, Anthropic
