# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Ronin (@DeRonin_) · 平台：X (Twitter) · 日期：2026-05-13

> 原始來源：https://x.com/DeRonin_/status/2054235707791778034

## 中文摘要

作者將 AI 程式開發帳單從 4,200 美元/月降至 312 美元/月。

本文完整拆解作者的 AI 程式開發帳單優化策略，強調無需新工具、無品質損失、無廉價替代品藉口，僅靠修復工作流程中 50-70% 的 token 浪費，即可本週末實作。作者批評大多數「vibe 程式設計師」忽略 token 經濟學，導致帳單暴增，根源在於「懶惰」而非模型價格過高。

**帳單暴增成因**

2026 年 vibe 程式設計師的成本圖表呈現曲棍球棒式暴增，Claude Code、Cursor、Aider、Windsurf 等工具皆基於相同經濟：輸入/輸出 token 計價，每百萬 token 收取固定費用。作者指出三重打擊導致危機：
- 模型變聰明且昂貴（Opus 4.6 輸入成本約為兩年前 GPT-3.5 的 10 倍）
- 工具自動加入更多上下文（Cursor 自動上下文、Claude Code 的程式庫意識、IDE 的 `@-everything`）
- Agentic 程式開發工作流程成預設（多步驟迴圈，每步全額計費）

結果：每日出貨的 vibe 程式設計師每月燒掉 2,000-5,000 美元，多數人未察覺浪費比例高達 50-70%。診斷非「模型太貴」，而是「支付懶惰」——多數 token 帳單來自可修復行為。

**核心洞見：支付上下文而非 token**

常見建議「換模型」是錯誤解，真正解在源頭：停止發送不必要 token。典型 vibe 程式設計師工作流程：
1. 開啟 Cursor
2. 自動上下文載入 47,000 token 的程式庫檔案
3. 要求「修復此函數 bug」
4. Claude 掃描 47,000 token 僅為找出 30 行關鍵程式碼
5. 返回 200 token 修復
6. 一天重複 50 次，成本 0.70 美元/輪 × 50 = 35 美元/天

實際訊號僅 30 行，但支付 Claude 50 次重讀整個程式庫。上下文紀律是關鍵槓桿，模型選擇僅為下游。

**token 經濟學基礎**

現代 AI 帳單分四類 token：
- 輸入 token：發送給模型的一切（提示、系統訊息、檔案內容、對話歷史），按百萬計價（$/M 輸入）
- 輸出 token：模型返回的一切（程式碼、解釋、推理），通常為輸入 3-5 倍價格
- 快取 token：近期請求標記快取的輸入 token，成本約正常輸入的 10%
- 推理 token：模型內部思考 token（如 Claude Opus），雖不可見仍計費

2026 年中近似定價（需查供應商頁面）：
- Claude Opus 4.6：15 美元 / 75 美元（輸入 / 輸出）
- GPT-5：10 美元 / 40 美元
- Claude Sonnet 4.6：3 美元 / 15 美元
- Claude Haiku 4.5：1 美元 / 5 美元
- Kimi 2.6 (Moonshot)：0.50 美元 / 2 美元

最貴與最便宜間差距達輸入 30 倍、輸出 35 倍。Sonnet 4.6 與 Kimi 2.6 間差距為輸入 6 倍、輸出 7.5 倍，但 95% 嚴肅程式撰寫品質無異——多數人付 Sonnet 價卻得 Kimi 等級輸出。

**五大 token 陷阱**

作者每月 4,200 美元帳單源自這五陷阱，逐一修復即可回收多數浪費。

**陷阱 1：每輪重發整個程式庫**

Cursor 或 Claude Code 自動上下文每提示包含相同 30-50 檔案（未變），50 檔案 = 80,000 輸入 token，Opus 定價下每輪 1.20 美元，50 輪/天 = 60 美元/天 = 1,800 美元/月。

修復：
- 關閉穩定檔案自動上下文，改用提示快取一次加入
- 先用 grep/ripgrep，只發送相關函數或區塊
- Cursor：停用 `@codebase`，改用特定 `@file`
- Claude Code：依賴 Agent 自身 grep 工具，非預載檔案

節省：穩定工作階段輸入 token 60-80%。

**陷阱 2：工具呼叫迴圈失控**

Agent 呼叫工具獲資料、重發全上下文、再呼叫、再重發，至第五次已付五次 50,000 token 上下文。

修復：
- 批次相關工具呼叫，先讓 Agent 預先規劃
- 積極摘要工具輸出，非直接回傳原始
- 已知流程用確定性 Python 輔助取代 Agentic 迴圈
- 剖析工具呼叫——記錄一週每呼叫輸入/輸出 token 數，找出失控迴圈

節省：Agentic 流程 3-5 倍成本降低。

**陷阱 3：高階模型處理廉價任務**

用 Opus 修「錯字」、格式化 JSON 或全域變數重命名，燒 8,000 推理 token 花 0.60 美元，Haiku 只需 0.02 美元。Sonnet 重構 500 行檔案輸出 0.12 美元、14 秒；Kimi 2.6 同樣重構僅 0.04 美元、16 秒，生產環境無異。

修復：
- 建路由（後述），瑣碎任務預設 Haiku 或本地
- 實作工作預設 Kimi 2.6（程式撰寫品質同 Sonnet，成本僅 1/6）
- Opus/GPT-5 限 10% 複合決策（架構、複雜重構）

作者實例：Agentic 重構迴圈全用 Opus 每次 18-24 美元，改僅規劃步用 Opus、25-30 迭代步路由至 Kimi 2.6，同樣程式碼、同樣測試通過，新成本 1.40 美元/次。高階模型迭代步未提供高階品質，純付多餘能力。

節省：清理/格式/檢查層 95%，中長 Agentic 迴圈 10-15 倍。

**陷阱 4：串流與批次錯用**

串流回應可能破壞某些工作流程快取；批次用錯則浪費使用者時間。

修復：
- 穩定前綴工作流程用批次（快取更佳）
- 互動程式撰寫用串流（UX 體驗）
- 背景 Agent 無使用者回饋一律批次

節省：正確批次快取前綴呼叫 30-50%。

**陷阱 5：「以防萬一」上下文膨脹**

不確定 Claude 是否需 `utils.ts`、測試檔案或 schema，全丟入，導致「修 bug」提示達 80,000 token。

修復：
- 先 grep/ripgrep，若無參照則模型無需檔案
- 讓 Agent 主動請求所需檔案，非主動提供
- 長工作階段定期摘要舊上下文，捨棄原檔
- 用 `CLAUDE.md` / 系統提示編碼靜態上下文一次快取

節省：輸入 token 70%+。

**路由架構：依任務拆分模型**

最大變革：依任務類型拆分多模型，而非單一模型全用。vibe 程式設計師常全用高階（Opus 貴）、全用廉價（Haiku 品質掉）或中庸（Sonnet 全用：付 6 倍價仍撞速率限制，最糟）。

智慧路由決策樹：
1. 規劃/架構任務？→ 高階層（Opus 4.6 或 GPT-5），10% 複合決策值此價
2. 實作、程式碼審核、重構、除錯或嚴肅程式撰寫？→ Kimi 2.6，每日主力，同 Sonnet 出貨品質、成本 1/6、無速率限制
3. 長 Agentic 迴圈多迭代？→ Kimi 2.6，成本優勢累乘
4. 檢查、格式、單行編輯、瑣碎修復？→ 工具層（Haiku 4.5）或 IDE 自動完成
5. 樣板、自動完成、stub 生成？→ 本地層（Ollama 的 Qwen 3），免費

現代工具（Cursor、Aider、Claude Code、Windsurf）皆支援自訂模型，30 分鐘建置，帳單降 50-70%。

**模型階層：任務對應精選**

**高階層（複合決策）**

Claude Opus 4.6：資深架構師，最佳判斷、最高成本（15/75 美元/M）。限系統設計、安全審核、複雜多檔重構、並發除錯，僅 10% 工作。

GPT-5.5：推理近 Opus（10/40 美元），數學任務領先，長上下文連貫及程式碼判斷略遜。

**主力層（每日主力）**

Kimi 2.6 (Moonshot)：現代 AI 程式開發堆疊真主力（0.50/2 美元）。作者直言：多數人錯用，Kimi 2.6 在重構、除錯、程式碼生成匹配或勝 Sonnet 4.6，成本僅 1/6。2025 年「廉價選項」框架已過時，2026 年應預設 Kimi，Sonnet 限特定強項。

Kimi 絕勝領域：
- 長 Agentic 迴圈（10+ 迭代）：30 步重構 Opus 25 美元、Sonnet 5 美元、Kimi 1 美元，同樣程式碼，狀態處理同 Sonnet
- 中高複雜程式碼生成：CRUD 端點、scaffold、多檔功能實作，品質同 Sonnet 頻段、價 1/6
- 大規模重構：500 行檔案重寫，Sonnet 邊際品質未現於 diff，Kimi 通過同測試
- 持續背景 Agent：Sonnet 每月 200-400 美元，Kimi 15-30 美元
- 高吞吐批次任務：Sonnet 速率限制排隊 30 分，Kimi 更快且限制寬鬆
- 長上下文：256k 視窗，連貫勝或匹敵 Sonnet

仍需他模型窄案例：
- 架構/系統設計 → Opus 或 GPT-5（10%）
- 生產 PR 安全審核 → Opus
- 專業領域（形式驗證、利基編譯器）→ 高階

嚴肅實作、除錯、審核、重構、Agentic 流程全歸 Kimi。框架：高階限 10% 複合決策、Kimi 90% 嚴肅出貨、Haiku/本地 10% 清理。Sonnet 僅薄薄「特定 Claude 怪癖」切片，非預設。2026 年預設 Sonnet 等於丟 60-70% 帳單。

**工具層（清理執行）**

Claude Haiku 4.5：初級工程師，快廉（1/5 美元）。限檢查、格式、單行編輯、重命名、簡單 stub，多步驟品質掉。

GPT-5 mini / o4-mini：OpenAI 生態 Haiku 等級，同價同用例。

**本地層（零成本）**

Qwen 3 / Llama 3 (Ollama)：筆電運行，0 美元/token。限自動完成、輸入、簡單完成、語法修復、非多步推理或需細微品質。

誠實評估：
- 僅一模型：2026 年選 Kimi 2.6，覆蓋 90% 高品質、低於單 Sonnet 訂閱
- 雙模型堆疊：Kimi 2.6 + Opus，精簡專家配置，較全 Sonnet 降 70%
- 大規模出貨：全路由（Opus/Kimi/Haiku/本地）方能維持品質與帳單理性

vibe 程式設計師錯在 2024-2025 行銷預設 Sonnet，2026 年成本品質數學變了，Kimi 品質追平、價差拉大。

**七項實務技巧：降 80% 成本不失品質**

全實作可達作者成果，若 workspace 應用疑問，可評論或私訊詢問。

**技巧 1：全啟用提示快取**

Anthropic、OpenAI、Moonshot 皆支援，快取 token 僅正常輸入 10%。將穩定上下文（`CLAUDE.md`、系統指示、程式庫摘要）置快取前綴，工作分 5 分鐘塊（快取 TTL）。
- Claude Code：系統提示及 `CLAUDE.md` 自動快取
- Cursor：設定 → 模型 → 「use prompt caching」
- Aider：傳 `--cache-prompts`

節省：穩定輸入 token 60-90%。

**技巧 2：先 grep 再取檔**

非「以防萬一」丟檔，先 grep 符號或模式，只取必要。

```bash
rg "useUserAuth" --type ts -l # 找檔案
rg "useUserAuth" --type ts -B 5 -A 20 # 帶上下文用法
```

90% 情況 30 行足夠，全檔直覺多錯。

**技巧 3：剖析工具呼叫**

一週記錄每工具呼叫輸入/輸出 token，找出失控迴圈及重取資料工具。

Claude Code 快速記錄：啟用 `--verbose-tools` 導至檔案，用 grep 析，鎖定最大 token 消耗。vibe 程式設計師僅修最差三迴圈即降 30-50%。

**技巧 4：畢業技能模式**

工作流程成功後存為 `SKILL.md`，下次 Agent 載入跳過發現階段。

實例：作者「deploy to staging」原 Opus 每次 4 美元（Agent 每次重推環境），寫成 `SKILL.md` 後換 Kimi 2.6，每次 0.18 美元，同樣成果。此為 Browserbase Autobrowse 瀏覽器 Agent 模式，一般化至程式撰寫。

**技巧 5：本地模型處理樣板自動完成**

Qwen 3 / Llama 3 經 Ollama = 0 美元/token，筆電跑。限自動完成、輸入、簡單完成、語法修復、非複雜推理。

5 分鐘設定：
```bash
brew install ollama
ollama pull qwen3:7b
ollama serve
```

IDE 自動完成指向 localhost:11434。

節省：樣板層 100%。

**技巧 6：長工作階段積極摘要**

每 10-15 輪後，讓 Agent 摘要已做及下一步，捨棄原對話，從摘要續。200k token 壓至 5k，下批新起僅 5% 成本。工具無提示，設 30 分鐘計時器。

**技巧 7：批次小請求**

非 10 個小問題單獨 API 呼叫（10 次前綴費），合一提示：
> 「回答以下 10 件事，編號 1-10...」

節省：批次工作輸入 token 70-90%，快取加乘。

**成本每真任務基準測試**

作者測試四任務跨主要模型（依任務類型及程式庫變異，形狀關鍵）：

任務：重構 500 行檔案  
Claude Opus 4.6：0.42 美元 / 18s / 9.5  
GPT-5：0.32 美元 / 16s / 9.4  
Sonnet 4.6：0.12 美元 / 14s / 9.0  
Kimi 2.6：0.04 美元 / 16s / 9.2  

任務：建 CRUD 端點  
Claude Opus 4.6：0.18 美元 / 22s / 9.0  
GPT-5：0.14 美元 / 20s / 9.0  
Sonnet 4.6：0.06 美元 / 18s / 9.0  
Kimi 2.6：0.02 美元 / 17s /

## 標籤

Skills, 教學資源, 產業趨勢, Claude Code, Cursor, Aider