# 策展 · X (Twitter) 🔥

> 作者：Alex (@alexgreensh) · 平台：X (Twitter) · 日期：2026-05-03

> 原始來源：https://x.com/alexgreensh/status/2050151504036712599

## 中文摘要

Token Optimizer 全面優化 token 浪費，兼顧品質追蹤與主動壓縮。

Token Optimizer 由 Alex Greenshpun 開發，針對 Claude Code、OpenClaw 與 Codex (beta) 等 Agent 系統，提供全方位的 token 優化工具，涵蓋執行時、結構與行為三類浪費，透過 7 項品質指標持續監測，並以即時儀表板呈現每筆 token、美元與回合細節，強調零 context token 消耗、零依賴與零遙測。

**安裝方式**

支援 macOS、Linux、Windows，推薦透過 plugin marketplace 安裝：
- Claude Code：`/plugin marketplace add alexgreensh/token-optimizer` 後 `/plugin install token-optimizer@alexgreensh-token-optimizer`，記得啟用 auto-update。
- OpenClaw：`openclaw plugins install github:alexgreensh/token-optimizer` 或 `openclaw plugins install token-optimizer`。
- Codex (beta)：`codex plugin marketplace add alexgreensh/token-optimizer`，再執行 `TOKEN_OPTIMIZER_RUNTIME=codex python3 skills/token-optimizer/scripts/measure.py codex-install --project "$PWD"` 與 `setup-daemon`。
macOS/Linux 另有 script 安裝 `git clone https://github.com/alexgreensh/token-optimizer.git ~/.claude/token-optimizer && bash install.sh`，但 Windows 避免混用以防 EBUSY 錯誤。版本 5.6.4，Python 3.8+，零依賴，PolyForm Noncommercial 授權。

**儀表板全域可見性**

單一 HTML 儀表板（`http://localhost:24842/token-optimizer`），每 session 結束自動更新，追蹤：
- 每回合 token 細分：input、output、cache-read、cache-write，偵測脈衝。
- 快取分析：堆疊圖顯示比例、TTL 混和（1h vs 5m）、命中率。
- 間隔指標：呼叫間距，辨識穩態或斷續。
- 4 種定價階層成本：Anthropic API、Vertex Global/Regional、AWS Bedrock。
- 品質分數顏色標記：綠健康、黃退化、紅危機。
- 子 Agent 成本：orchestrator vs worker，前 5 高耗項，超 30% 警示。
- 每 session 前 5 高成本 prompt：使用者訊息配回應成本。
- 技能採用趨勢：實際呼叫 vs 安裝。
- 模型混和：Opus、Sonnet、Haiku 比例。
- CLAUDE.md 與 MEMORY.md 健康卡：行數、孤兒數、狀態。
- 漂移偵測：配置快照比較。
- 節省追蹤：累計美元從優化、還原、封存。

執行 `python3 measure.py setup-daemon` 即啟用 bookmarkable URL，Codex 用 24843 埠。

**三大浪費類型優化**

多數工具僅處理 15-25% 執行時浪費（verbose 命令輸出），忽略 75-85% 結構浪費（臃腫 CLAUDE.md、未用技能、重複 system prompt、陳舊 MEMORY.md、compaction 損失 60-70%）。Token Optimizer 全面涵蓋，並在 compaction 前 checkpoint、事後還原，確保節省持久。

- **執行時浪費**：代理壓縮器處理，但僅小部分。
- **結構浪費**：移除未用元件、不碰 conversation 內容，保全 prompt cache。
- **行為浪費**：品質退化追蹤，MRCR 從 256K 的 93% 降至 1M 的 76%，AI 變笨。

完全本地，SQLite 存 `~/.claude/_backups/token-optimizer/trends.db`，零 context 消耗。

**實際節省數據**

重度 Opus 使用者 30 天 942 sessions、6.13B input token、90% Opus、82% cache hit 率，月省 $1,500 至 $2,500。Input 節省 $590，其餘來自迴圈偵測、適時 `/compact`、避壞 compaction。輕度使用者比例縮減，結構審核立即生效，小 prefix 降低後續 cache-read 計費。

**品質評分系統**

透過 7 項指標監測 context 品質，並以顏色標記退化程度（綠色健康、黃色退化、紅色危機），協助使用者判斷 AI 是否因 context 膨脹而變笨：
- Context fill：距退化懸崖多近。
- Stale reads：早讀檔案變更，AI 用舊資訊。
- Bloated results：未用工具輸出，噪音佔 context。
- Compaction depth：每次損 60-70%，2-3 次後 88-95% 亡。
- Duplicates：重複 system 提醒。
- Decision density：真對話 vs overhead。
- Agent efficiency：子 Agent 貢獻 vs 燒 token。

**v5 主動壓縮功能**

不止測量，主動減 bloat，7 項預設開，獨立 toggle（CLI、env var、儀表板 Manage tab），本地 SQLite 測量節省：
| 功能 | 預設 | 潛在節省 | 風險 |
|------|------|----------|------|
| Quality Nudges | ON | 每 compact 填%回收 | 無 |
| Loop Detection | ON | 實測迴圈 turn 內容，平均 47K 浪費 | 無 |
| Delta Mode | ON | ~20%，智慧重讀 | 低 |
| Structure Map | ON (soft-block) | ~30%，大檔重讀 95-99% | 低 |
| Bash Compression | ON | ~10%，CLI 輸出 | 低 |
| Activity Mode | ON | 適應 session 階段 | 無 |
| Decision Extraction | ON | 跨 compaction 保決定 | 無 |

- **Quality Nudges**：分數降 15+ 或 <60，inline 註記建議 `/compact`，5 分冷卻、session max 3。
- **Loop Detection**：比對末 4 user msg+5 工具結果，≥0.7 信心觸發，session max 2。
- **Delta Mode**：編輯後重讀僅 diff（difflib，97% 省），65%+ Read 為重讀，限 50KB、排除憑證。
- **Structure Map**：重讀代碼檔給 AST 摘要（Python 800KB/20K 行、JS/TS 400KB/5K 行），180K token 變 250。
- **Bash Compression**：16 handlers（git、pytest、lint、log、tree、docker、ls、build、test runner），覆蓋 90% verbose CLI，掃描保憑證、多語錯誤，排除複合命令。
- **Activity Mode**：5 模式（code/debug/review/infra/general），基末 10 工具呼叫，導 compaction 優先。
- **Decision Extraction**：regex 抽 "chose X because Y" 等，compaction 時標 CRITICAL。

測量 `python3 measure.py compression-stats --days 30`，verified 旗標精確前後。

**智慧壓縮與連續性**

Auto-compact 亡 60-70% 對話，Token Optimizer 多門檻（20/35/50/65/80%、品質<80/70/50/40）漸進 checkpoint，選最富還原。工具結果>4KB 自動封存，替換預覽+`expand abc123` 提示，model 自動擴展無重跑。

- `python3 measure.py setup-smart-compact` 啟用。
- `python3 measure.py expand --list` 清單，手動取。
- Session end/clear/crash auto-checkpoint，新 session 掉 breadcrumb。

**即時品質條**

終端顏色移轉（綠→紅），<75% 秀 session 持續警示、子 Agent 模型/時間。`python3 measure.py setup-quality-bar`，`/statusline` 覆寫自動還原，`--uninstall` 永關。

**教練模式與審核器**

`/token-coach` 給目標，得優先修復+token 省，偵 8 反模式（Kitchen Sink、Hoarder、Monolith）。Fleet Auditor 跨平台掃閒燒、模型錯導、config bloat。

11 偵測器：
- PDF/binary 大檔、web 搜尋 overhead、retry churn（3+次）、tool cascade（3+連錯）、looping、overpowered model（Opus 簡單編輯）、weak model、bad decomposition（500+字 prompt）、wasteful thinking（>2x 輸出）、output waste、cache instability。

子 Agent 成本分、costly prompt rank 5、CLAUDE.md 路由注入（`measure.py inject-routing`）。

**MEMORY.md 健康審核**

Claude 僅載前 200 行，後續隱形計 token。`memory-review` 掃：
- 孤兒 topic 檔、壞連結、>200 行隱形、inline 內容、重複規則、陳舊、task leakage。
`--apply` 給修復，儀表板健康卡。

**讀取快取與 context 工具**

- PreToolUse 讀快取：重讀不變檔給結構摘要，省 8-30%。
- Git-aware：建議 test 伴侶、co-change、import chain。
- .contextignore：gitignore 式阻檔。
- Attention Optimizer：U 形曲線評 CLAUDE.md，移關鍵規則（NEVER/ALWAYS/MUST）高關注區。
- JSONL 工具：inspect/trim/dedup。
- Savings tracking：累計美元。

**指令清單**

| 指令 | 內容 |
|------|------|
| quick | 10秒健康、風險、罪魁、模型建議 |
| doctor | 安裝分數/10、修復命令 |
| drift | 配置成長比 |
| quality | 7指標即時 |
| report | 每元件細分 |
| conversation | 每訊息 token/成本+脈衝 |
| pricing-tier | 定價切換 |
| kill-stale | 關>12h headless |
| git-context | 相關檔建議 |
| trends | 技能/模型/軌跡 |
| coach | 反模式+多 Agent 設計 |
| memory-review | MEMORY結構審 |
| dashboard | 全HTML |
| savings | 累計省美元 |
| attention-score | CLAUDE.md結構分 |
| jsonl-inspect | session stats |
| expand | 取封存結果 |

`/token-optimizer` 6 Agent 互動審核+guided 修復。

**比較優勢**

| 能力 | Token Optimizer | /context | context-mode | Proxy compressors |
|------|-----------------|----------|--------------|-------------------|
| 結構審核 | 深逐元件 | 摘要 | 無 | 無 |
| 品質追蹤 | 7指標 | 容量% | 無 | 無 |
| Compaction存活 | 漸進checkpoint+還原+摘要 | 無 | 會話導 | 無 |
| 執行壓縮 | 30+家族、可toggle | 無 | 是 | 是，恆開 |
| 測壓縮助益 | 是，本地前後 | 無 | 無 | 無 |
| 讀重複diff | 是 | 無 | 無 | 無 |
| 教練路由 | 11偵+子Agent分 | 基本 | 無 | 無 |
| 文件健康 | 8審+關注曲線 | 無 | 無 | 無 |
| Fleet偵測 | 是 | 無 | 無 | 無 |
| 零context | 是，外程 | +200t | MCP | 注入 |
| 零依賴 | 是，stdlib | N/A | 變 | 外二進 |
| 零遙測 | 是 | 是 | 變 | opt-out |
| 跨平台 | Claude/OpenClaw/Codex等 | Claude限 | 多 | 多 |

代理僅 15-25%，不碰其餘，且易壞 cache（改現有 block 重發全 prefix）。Token Optimizer 不碰現 context，保 cache 雙省（少 input+低 cache-read）。

**VS Code 與其他平台**

VS Code 擴充全功（除 status 線 CLI 限），用內建終端或 bookmark dashboard。OpenClaw 原生 TS，Codex beta 適 AGENTS.md/GPT-5.x。Windsurf/Cursor roadmap。

**授權與信任**

PolyForm Noncommercial，小團隊<$20k/月免費商業。小型轉商業有 32 天緩衝，大企聯絡 Alex。FAQ 強調無降質（僅移除未用）、不壞 cache（不改 prefix）、零網呼、fail-open、無依賴。品質分追退化，壓縮 toggle 保全。

**為何優先安裝**

1M context（Opus/Sonnet 4.6）幌子，50-70K 開頭 overhead，填滿退質、率限快、compaction 災（2-3 次 88-95% 亡）、高努力速燒、無視覺猜錯花錢。Token Optimizer 顯露全貌，結構優化僅碰安全（未用、重複、孤兒），保 conversation，實測分數多升（多室實工）。

## 標籤

Claude Code, Codex, Agent, 開源專案, 其他, Token Optimizer, Claude Code, OpenClaw
