Claude推出prompt caching開發者控制台新增儀表板
AI 語音朗讀 · Edge TTS
Claude推出prompt caching開發者控制台新增儀表板。
Claude開發者控制台新增儀表板,提供prompt caching使用情況可視化,協助使用者優化API消耗;此功能透過快取提示前綴大幅縮短處理時間與費用,尤其適合重複任務。新功能相容Zero Data Retention (ZDR),ZDR組織的資料在API回應後即不儲存。
啟用方式
Claude提供兩種prompt caching啟用方法:
- 自動快取:在請求頂層新增單一cache_control欄位,系統自動將快取斷點置於最後可快取區塊,並隨對話成長前移;最適合多輪對話中自動快取累積訊息歷史。
- 明確快取斷點:直接在個別內容區塊置入cache_control,精準控制快取範圍。
最簡單入門即自動快取,系統會快取至最後可快取區塊的所有內容,後續相同前綴請求自動重用快取。
運作機制
請求啟用prompt caching時:
- 系統檢查指定快取斷點前的前綴是否於近期查詢中已快取。
- 若存在,即重用快取版本,降低處理時間與成本。
- 否則完整處理提示,並於回應開始時快取前綴。
快取預設存活5分鐘,每次重用時免費刷新;若5分鐘不足,Anthropic提供1小時快取但收取額外費用。快取涵蓋完整前綴,包括工具、系統提示與訊息(依序)至指定cache_control區塊為止。此設計特別適用:
- 含多例子的提示
- 大量脈絡或背景資訊
- 具一致指示的重複任務
- 長多輪對話
定價結構
Prompt caching引入新定價,每百萬token價格依模型而異,以下為各模型細項(單位:美元/百萬token):
| 模型 | 基礎輸入 token | 5分鐘快取寫入 | 1小時快取寫入 | 快取命中與刷新 | 輸出 token |
|---|---|---|---|---|---|
| Claude Opus 4.7 | $5 | $6.25 | $10 | $0.50 | $25 |
| Claude Opus 4.6 | $5 | $6.25 | $10 | $0.50 | $25 |
| Claude Opus 4.5 | $5 | $6.25 | $10 | $0.50 | $25 |
| Claude Opus 4.1 | $15 | $18.75 | $30 | $1.50 | $75 |
| Claude Opus 4 | $15 | $18.75 | $30 | $1.50 | $75 |
| Claude Sonnet 4.6 | $3 | $3.75 | $6 | $0.30 | $15 |
| Claude Sonnet 4.5 | $3 | $3.75 | $6 | $0.30 | $15 |
| Claude Sonnet 4 | $3 | $3.75 | $6 | $0.30 | $15 |
| Claude Sonnet 3.7 (deprecated) | $3 | $3.75 | $6 | $0.30 | $15 |
| Claude Haiku 4.5 | $1 | $1.25 | $2 | $0.10 | $5 |
| Claude Haiku 3.5 | $0.80 | $1 | $1.6 | $0.08 | $4 |
| Claude Opus 3 (deprecated) | $15 | $18.75 | $30 | $1.50 | $75 |
| Claude Haiku 3 | $0.25 | $0.30 | $0.50 | $0.03 | $1.25 |
定價倍數為:5分鐘快取寫入為基礎輸入價格的1.25倍、1小時快取寫入為2倍、快取讀取為0.1倍;這些倍數可疊加Batch API折扣與資料駐留等其他調整,詳見完整定價文件。
支援模型與資源
自動與明確prompt caching均支援所有活躍Claude模型,包括Claude Opus、Sonnet與Haiku系列(部分舊版如Sonnet 3.7、Opus 3標記為deprecated)。Claude開發者控制台新增儀表板(http://platform.claude.com/usage/cache),提升使用可視化,幫助降低成本與TTFT(Time to First Token)。相關資源包括RLanceMartin的prompt caching文章(https://x.com/RLanceMartin/status/2024573404888911886)與trq212的最大化快取命中率貼文(https://x.com/trq212/status/2024574133011673516?s=20),提供深入提示。
此功能強調快取對客戶降低成本與延遲的關鍵性,透過精準前綴重用解決重複提示痛點,同時維持ZDR隱私保障,展現Anthropic在API優化上的實務導向。
Caching is critical for customers to lower both costs and TTFT.
— ClaudeDevs (@ClaudeDevs) April 21, 2026
We’re launching a new dashboard in Claude Developer Console to increase visibility and help customers optimize their usage.
Check it out here: https://t.co/zgBJ4dHXyI pic.twitter.com/Uwje2iPbLT
What is prompt caching? Learn more in @RLanceMartin's article on prompt caching in the Claude API: https://t.co/GW9D0wEDnI
— ClaudeDevs (@ClaudeDevs) April 21, 2026
Learn tips on how to maximize your prompt cache hit rate in @trq212's post: https://t.co/3n7z1rLwbk
— ClaudeDevs (@ClaudeDevs) April 21, 2026
