# 策展 · X (Twitter) 🔥🔥🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：ClaudeDevs (@ClaudeDevs) · 平台：X (Twitter) · 日期：2026-07-03

> 原始來源：https://x.com/ClaudeDevs/status/2072818299361263778

## 中文摘要

Anthropic 調整 Claude Platform API 速率限制機制。

**速率限制更新**
Anthropic 宣布全面簡化 Claude Platform 的 API 速率限制（Rate Limits）分級制度，不再將 API 支出金額作為升級門檻。此次更新重點包括：
- 最新版本的 Sonnet 與 Haiku 模型在最高等級（Scale tier）中，其速率限制提升至原先的 5 倍。
- 各個速率等級現在針對 Opus、Sonnet 與 Haiku 模型提供一致的每分鐘請求數（RPM）與 token 吞吐量，讓開發者能根據任務需求選擇最合適的模型，無需再因速率限制而妥協。
- 系統會自動根據使用量調整速率等級，使用者亦可透過 [Claude Console](https://platform.claude.com/) 手動申請提高限制。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/284b6e83784e20f7.png)
> Anthropic 提高了 Claude API 的速率限制並簡化層級，最新的 Sonnet 和 Haiku 模型在最高層級（Scale）提供高達 5 倍的速率限制，且各層級在 Opus、Sonnet 和 Haiku 模型間皆享有相同的每分鐘請求數與 Token 吞吐量。

**API 限制架構與監控**
根據 [Claude Platform 官方文件](https://platform.claude.com/docs/en/api/rate-limits)，API 的使用限制主要分為「支出限制」（Spend limits）與「速率限制」（Rate limits）兩大類，用來防止濫用並確保資源公平分配。
- **速率計算**：API 採用「token 桶演算法」（token bucket algorithm），容量會持續補充而非在固定時間重置。
- **快取優化**：對於大多數模型，僅有未快取的輸入 token 會計入 ITPM（每分鐘輸入 token 數）限制，這意味著透過「prompt caching」技術，開發者能顯著提升實際的處理吞吐量。
- **管理工具**：使用者可於 Claude Console 的「Usage」頁面監控即時的 token 與請求使用量，並可針對特定 `workspace` 設定自訂的支出與速率上限，以保護組織內部的資源分配。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/063adf9377904109.png)
> 在 Scale 方案層級中，Claude Sonnet 5、Claude Opus 4.x 與 Claude Sonnet 4.x 均提供相同的速率限制（每分鐘 10K 次請求、10M 輸入 tokens 及 2M 輸出 tokens），讓使用者能依任務需求自由選擇合適的模型，無需因速率限制而妥協。

若開發者遇到 429 錯誤，API 回應標頭（如 `retry-after`）會提供詳細的重試建議與限制狀態。針對超過 Scale 等級的需求，使用者可透過 Claude Console 聯繫銷售團隊進行客製化配置。

## 媒體內容

**Anthropic 提高了 Claude API 的速率限制並簡化層級，最新的 Sonnet 和 Haiku 模型在最高層級（Scale）提供高達 5 倍的速率限制，且各層級在 Opus、Sonnet 和 Haiku 模型間皆享有相同的每分鐘請求數與 Token 吞吐量。**

**數據表**

|   | Requests per minute | Input tokens per minute | Output tokens per minute |
| --- | --- | --- | --- |
| Start | 1,000 | 2M | 400K |
| Build | 5,000 | 5M | 1M |
| Scale | 10,000 | 10M | 2M |

**在 Scale 方案層級中，Claude Sonnet 5、Claude Opus 4.x 與 Claude Sonnet 4.x 均提供相同的速率限制（每分鐘 10K 次請求、10M 輸入 tokens 及 2M 輸出 tokens），讓使用者能依任務需求自由選擇合適的模型，無需因速率限制而妥協。**

**數據表**

|   | Requests per minute | Input tokens per minute | Output tokens per minute |
| --- | --- | --- | --- |
| Claude Sonnet 5 | 10K | 10M | 2M |
| Claude Opus 4.x | 10K | 10M | 2M |
| Claude Sonnet 4.x | 10K | 10M | 2M |

## 標籤

功能更新, LLM, Anthropic, Claude