# 企業 AI 的 token 支出問題本質上是架構設計的挑戰，而非單純的模型成本問題

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 原作者：Arvind Jain (@jainarvind) · 策展與摘要：EasyVibeCoding · 平台：X (Twitter) · 熱度：🔥 · 日期：2026-06-04

> 原始來源：https://x.com/jainarvind/status/2062294414714945764

## 證據與延伸閱讀

- [deloitte.com](https://www.deloitte.com/us/en/insights/topics/digital-transformation/ai-tech-investment-roi.html)
- [quaeris.ai](https://blog.quaeris.ai/blog/ai-spending-is-a-boom-not-a-bubble)
- [diligent.com](https://www.diligent.com/resources/blog/erm-trends-2024)
- [ramp.com/3-steps-to-manage-ai-spend](https://ramp.com/3-steps-to-manage-ai-spend)
- [ramp.com/ai-cost-monitoring](https://ramp.com/ai-cost-monitoring)
- [forbes.com](https://www.forbes.com/sites/janakirammsv/2026/05/17/uber-burns-its-2026-ai-budget-in-four-months-on-claude-code/)
- [cfodive.com](https://www.cfodive.com/news/ubers-finance-team-overtaken-engineering-ai-use/821513/)
- [glean.com](https://www.glean.com/blog/cowork-mcp-eval)
- [itbrief.news/story/glean-says-remote-mcp-server-beats-rivals-in-tests](https://itbrief.news/story/glean-says-remote-mcp-server-beats-rivals-in-tests)

## 中文摘要

企業 AI 的 token 支出問題本質上是架構設計的挑戰，而非單純的模型成本問題。隨著 AI 從簡單的聊天助理轉向 Agentic 程式開發、AI 同事及長週期工作流程，系統在每個任務中處理的內容大幅增加，導致企業面臨「產出價值是否足以抵銷 token 成本」的營運壓力。

**成本失控的現狀**
目前的支出訊號已不容忽視，企業正投入大量預算於 AI 專案，但 token 消耗與商業價值的成長卻不成正比：
- 「Deloitte」的 2025 年技術價值調查顯示，受訪者平均將 36% 的數位計畫預算分配給 AI。
- 「Ramp」報告指出，每月 AI 支出年增率高達 4 倍。
- 「Fortune」報導，「Uber」在四個月內就耗盡了 2026 年全年的 AI 程式撰寫工具預算。

**重新定義經濟指標**
企業應將關注點從「原始 token 用量」轉向「token 產出率（token yield）」，即系統在消耗每個 token 後所產生的有效成果。token 的消耗並非僅由模型決定，而是由整個系統架構所驅動，包括內容檢索、工具介面、任務拆解、模型路由及執行軌跡的重用。若架構設計不當，即便輸出品質未提升，token 支出仍會持續攀升。

**架構設計的四大關鍵槓桿**
要提升 token 效率，必須從以下四個面向進行架構優化：

- **內容品質（Context quality）**：模型會處理所有輸入的資訊，若檢索到的內容雜亂無章，模型將浪費 token 在無關或衝突的資訊上。根據「Glean」的基準測試，其集中式索引在處理「Claude Cowork」類型的任務時，表現優於現成的「MCP」工具，且後者在正確性相同的情況下，消耗的 token 多出約 83k，顯示低劣的檢索架構會導致系統必須透過更多的工具呼叫與推理迴圈來彌補。
- **模型路由（Model routing）**：並非所有 Agentic 工作流程的步驟都需要頂尖模型（frontier model）。企業應採用多模型架構，將搜尋、工具選擇與執行管理等操作性步驟交由專用模型處理，僅在需要複雜推理時才呼叫頂尖模型，避免為例行工作支付高額費用。
- **持續學習（Continual learning）**：系統不應每次都從零開始解決同一類問題。透過累積執行軌跡（trace data），系統能記錄哪些工具有效、哪些路徑成功，從而避免重複探索。這種能從過往執行中學習的系統，能隨時間降低重複工作的成本，實現經濟效益的複利成長。
- **harness 設計（Harness design）**：在處理長週期、多步驟任務時，若 harness 設計不當，會導致 active context window 不斷膨脹，增加成本並降低可靠性。優秀的 harness 應將內容視為需管理的資源，而非無止盡的累積。具體做法包括：將工具範圍限制在當前步驟、將工作分配給專用 Agent、將中間狀態外部化，並僅提供模型所需的最小工作集。

總結來說，AI 的競爭優勢不在於單一模型，而在於執行效率。企業必須透過精細化的架構設計，確保每一分 token 支出都能轉化為實質的業務價值。

## 標籤

產業趨勢, Agent, AIGC, Harness, Deloitte, Ramp