← 返回首頁

Claude推出prompt caching開發者控制台新增儀表板

ClaudeDevs
ClaudeDevs
@ClaudeDevs
1,148🔁 74
𝕏 (Twitter)🔥🔥🔥🔥

AI 語音朗讀 · Edge TTS

AI 中文摘要Claude 生成

Claude推出prompt caching開發者控制台新增儀表板。

Claude開發者控制台新增儀表板,提供prompt caching使用情況可視化,協助使用者優化API消耗;此功能透過快取提示前綴大幅縮短處理時間與費用,尤其適合重複任務。新功能相容Zero Data Retention (ZDR),ZDR組織的資料在API回應後即不儲存。

啟用方式
Claude提供兩種prompt caching啟用方法:

  • 自動快取:在請求頂層新增單一cache_control欄位,系統自動將快取斷點置於最後可快取區塊,並隨對話成長前移;最適合多輪對話中自動快取累積訊息歷史。
  • 明確快取斷點:直接在個別內容區塊置入cache_control,精準控制快取範圍。

最簡單入門即自動快取,系統會快取至最後可快取區塊的所有內容,後續相同前綴請求自動重用快取。

運作機制
請求啟用prompt caching時:

  1. 系統檢查指定快取斷點前的前綴是否於近期查詢中已快取。
  2. 若存在,即重用快取版本,降低處理時間與成本。
  3. 否則完整處理提示,並於回應開始時快取前綴。

快取預設存活5分鐘,每次重用時免費刷新;若5分鐘不足,Anthropic提供1小時快取但收取額外費用。快取涵蓋完整前綴,包括工具、系統提示與訊息(依序)至指定cache_control區塊為止。此設計特別適用:

  • 含多例子的提示
  • 大量脈絡或背景資訊
  • 具一致指示的重複任務
  • 長多輪對話

定價結構
Prompt caching引入新定價,每百萬token價格依模型而異,以下為各模型細項(單位:美元/百萬token):

模型 基礎輸入 token 5分鐘快取寫入 1小時快取寫入 快取命中與刷新 輸出 token
Claude Opus 4.7 $5 $6.25 $10 $0.50 $25
Claude Opus 4.6 $5 $6.25 $10 $0.50 $25
Claude Opus 4.5 $5 $6.25 $10 $0.50 $25
Claude Opus 4.1 $15 $18.75 $30 $1.50 $75
Claude Opus 4 $15 $18.75 $30 $1.50 $75
Claude Sonnet 4.6 $3 $3.75 $6 $0.30 $15
Claude Sonnet 4.5 $3 $3.75 $6 $0.30 $15
Claude Sonnet 4 $3 $3.75 $6 $0.30 $15
Claude Sonnet 3.7 (deprecated) $3 $3.75 $6 $0.30 $15
Claude Haiku 4.5 $1 $1.25 $2 $0.10 $5
Claude Haiku 3.5 $0.80 $1 $1.6 $0.08 $4
Claude Opus 3 (deprecated) $15 $18.75 $30 $1.50 $75
Claude Haiku 3 $0.25 $0.30 $0.50 $0.03 $1.25

定價倍數為:5分鐘快取寫入為基礎輸入價格的1.25倍、1小時快取寫入為2倍、快取讀取為0.1倍;這些倍數可疊加Batch API折扣與資料駐留等其他調整,詳見完整定價文件。

支援模型與資源
自動與明確prompt caching均支援所有活躍Claude模型,包括Claude Opus、Sonnet與Haiku系列(部分舊版如Sonnet 3.7、Opus 3標記為deprecated)。Claude開發者控制台新增儀表板(http://platform.claude.com/usage/cache),提升使用可視化,幫助降低成本與TTFT(Time to First Token)。相關資源包括RLanceMartin的prompt caching文章(https://x.com/RLanceMartin/status/2024573404888911886)與trq212的最大化快取命中率貼文(https://x.com/trq212/status/2024574133011673516?s=20),提供深入提示。

此功能強調快取對客戶降低成本與延遲的關鍵性,透過精準前綴重用解決重複提示痛點,同時維持ZDR隱私保障,展現Anthropic在API優化上的實務導向。