# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Anthropic (@AnthropicAI) · 平台：X (Twitter) · 日期：2026-06-05

> 原始來源：https://x.com/AnthropicAI/status/2062568862479208923

## 中文摘要

Anthropic 發表 Claude 加速 AI 自主開發進程。

**開發效率的顯著躍升**
Anthropic 指出，隨著 AI 代理從單純的程式碼建議轉向自主執行任務，工程團隊的生產力出現了爆發式成長。截至 2026 年 5 月，Anthropic 程式庫中超過 80% 的程式碼由 Claude 撰寫，而 2025 年 2 月「Claude Code」研究預覽版推出前，此比例僅為個位數。目前 Anthropic 工程師每季交付的程式碼量，已達到 2021 至 2025 年平均水準的 8 倍。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780620202082-hbMAE6prmpngnameorig.png)
> 這張圖表顯示了自 2025 年以來，隨著 Claude 系列模型的發布與演進，每位開發者平均貢獻的程式碼量呈現顯著的成長趨勢。

**程式碼品質與執行效能**
Claude 在處理開放式程式設計問題的成功率，在短短六個月內提升了 50 個百分點，達到 76%。在程式碼品質方面，許多工程師認為 Claude 目前產出的程式碼已與人類水準相當，預計一年內將超越人類。此外，Claude 在優化演算法效能的表現上已達「超人類」水準：
- 2024 年 5 月，Claude Opus 4 對小型 AI 模型訓練程式碼的優化速度約為 3 倍。
- 2026 年 4 月，Mythos Preview 版本已能實現約 52 倍的效能提升，而熟練的人類研究員通常需耗時 4 至 8 小時才能達到 4 倍的優化效果。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780620204625-6a4AAUiXVjpgnameorig.jpg)
> 此圖表呈現 Claude Code 自 2025 年 9 月至 2026 年 6 月期間，針對不同難度任務的會話成功率隨模型迭代的成長趨勢。

**研究判斷力的演進**
除了工程任務，Claude 在研究決策上的表現也持續進步。透過回顧人類研究員曾走入死胡同的實驗過程，研究團隊發現 Claude Mythos Preview 在判斷下一步該如何執行時，有 64% 的情況優於人類選擇，該數據在 2024 年僅為 22%。儘管如此，Anthropic 強調目前 Claude 仍缺乏選擇「正確研究問題」的判斷力，這是邁向完全自主研發的關鍵門檻。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780620206895-70acAAmFXjpgnameorig.jpg)
> 這張圖表呈現了 Claude 系列模型在研究任務中，其建議優於人類研究員決策的比例隨時間演進的成長趨勢。

**未來風險與研究方向**
Anthropic 認為，若目前的技術趨勢持續，AI 系統自主設計並建構後繼者的可能性將大幅增加。這雖然可能為醫學、科技與經濟帶來巨大貢獻，但也可能加劇對齊（Alignment）問題，甚至導致人類失去對系統的控制。為此，Anthropic Institute 將與外部利害關係人合作，深入研究這些強大系統的潛在影響，並探討如何確保人類能對未來技術發展做出審慎的選擇。詳細分析報告可參閱 [Anthropic Institute 官方說明](https://www.anthropic.com/institute/recursive-self-improvement) 。

## 標籤

Claude Code, Agent, 功能更新, 產業趨勢, Anthropic, Claude
