# Anthropic發布Claude Code品質退化事後檢討，確認三項變更導致問題，已全數修復並重置所有訂閱者使用限制

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 原作者：ClaudeDevs (@ClaudeDevs) · 策展與摘要：EasyVibeCoding · 平台：X (Twitter) · 熱度：🔥 · 日期：2026-04-24

> 原始來源：https://x.com/ClaudeDevs/status/2047371123185287223

## 證據與延伸閱讀

- [Claude Code品質退化事後檢討](https://www.anthropic.com/engineering/april-23-postmortem)
- [Opus 4.7獨立問題處理中](https://x.com/bcherny/status/2047371123185287223)

## 中文摘要

Anthropic發布Claude Code品質退化事後檢討，確認三項變更導致問題，已全數修復並重置所有訂閱者使用限制。

過去一個月，使用者回報Claude Code品質下滑，Anthropic深入調查後確認三項獨立變更為根因，分別影響Claude Code、Claude Agent SDK及Claude Cowork，但Claude API未受波及。三項問題已在4月20日v2.1.116版本全數修復，公司強調絕非刻意退化模型，並對使用者耐心致謝。

**第一項問題：預設推理努力度調整失當**

3月4日，Anthropic將Claude Code的預設推理努力度從「high」降至「medium」，目的是減少高努力模式下偶發的極長延遲，導致UI看似凍結。此變更影響Sonnet 4.6及Opus 4.6，但被視為錯誤權衡，因為模型思考時間越長，輸出品質越佳，而努力度正是測試時計算曲線上的取捨點。

- 內部評估顯示，medium努力度在多數任務中智慧略降但延遲大幅改善，避免長尾延遲並最大化使用限制。
- 推出後，使用者立即回報Claude Code感覺變笨，公司雖添加啟動通知、內嵌努力度選擇器及「ultrathink」選項，但多數使用者維持medium預設。
- 4月7日，公司聽取更多回饋後回滾變更，目前Opus 4.7預設「xhigh」努力度，其他模型預設「high」，讓使用者可自行選擇低努力處理簡單任務。

**第二項問題：快取優化引入記憶清除bug**

3月26日，為提升效率，Anthropic部署變更：在閒置超過一小時的session中清除舊思考內容，利用prompt caching降低延遲與成本。設計意圖是用「clear_thinking_20251015」API header搭配keep:1，只清除一次舊思考，讓後續請求恢復完整推理歷史。

- 實作bug導致清除不僅一次，而是每回合持續發生：閒置門檻觸發後，每個請求僅保留最新思考區塊，丟棄先前所有內容，甚至中斷工具呼叫時當前回合推理也遺失。
- 這造成Claude顯得健忘、重複，並做出奇怪工具選擇；連續cache miss也加速使用限制耗盡。
- 兩個無關實驗（內部伺服器端訊息佇列實驗及CLI顯示思考變更）掩蓋bug，讓內部測試及dogfooding未察覺，耗時逾一週才確認根因。

調查中，用Opus 4.7回測Code Review對問題pull requests，成功找出bug（Opus 4.6未能），因此新增支援額外程式庫作為code review上下文。4月10日v2.1.101版本修復此bug。

**第三項問題：系統提示限制冗長度損害程式碼品質**

Opus 4.7相較前代更傾向冗長，這提升難題智慧但增加輸出token。4月16日Opus 4.7發布前，公司優化harness及產品，新增系統提示限制：「工具呼叫間文字≤25字，最終回應≤100字，除非任務需更多細節」。

- 內部多週測試及既有評估無退化跡象，遂隨Opus 4.7上線，影響Sonnet 4.6、Opus 4.6及Opus 4.7。
- 調查擴大評估及消融測試（逐行移除提示檢視影響）顯示Opus 4.6及4.7均降3%，4月20日立即回滾。

此外，使用者回報Opus 4.7在Claude Code的獨立問題，團隊正處理並將陸續推出改善。

**問題偵測挑戰與整體影響**

三項變更影響不同流量片段及時程，造成看似廣泛不一致退化。3月初即啟動調查，但初期難與正常回饋變異區分，內部使用及評估也未重現。

- 公司承認這非使用者應期待體驗，4月23日重置所有訂閱者使用限制。
- 社群回饋如Joe指出重置僅一週後再度重置「毫無差別」，Bagchi da抱怨等一週剩3小時49分鐘，已忘專案細節，凸顯使用者挫折。

模型本身無退化，問題限於Claude Code及Agent SDK harness（Cowork依賴SDK）。

**未來防範措施**

Anthropic承認調查為團隊史上最複雜，根因隱晦且多混淆因素。公司將強化內部dogfooding，使用完全匹配公眾build的配置；擴大評估套件，對孤立系統提示變更執行測試。

- 對系統提示變更加嚴格管制：每改必跑per-model廣泛評估、消融分析、新工具簡化審核稽核；CLAUDE.md新增指引確保模型專屬變更；智慧權衡變更須浸泡期、廣評估及漸進推出。
- 改善內部Code Review工具並推給客戶；擴大內部員工使用公眾Claude Code版本。
- 新增@ClaudeDevs X帳號及GitHub集中討論串，深入解釋產品決策。

公司感謝社群透過/feedback指令及線上具體可重現範例，讓問題曝光並修復，重申對回饋的感激及耐心支持。完整事後檢討見：https://www.anthropic.com/engineering/april-23-postmortem。

## 標籤

Claude Code, 功能更新, Agent, Anthropic, Claude