# 策展 · X (Twitter) 🔥🔥🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Claude (@claudeai) · 平台：X (Twitter) · 日期：2026-06-09

> 原始來源：https://x.com/claudeai/status/2064394146916229443

## 中文摘要

Anthropic 正式推出 Claude Fable 5——迄今效能最強大的 Agentic 模型。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1781026913918-2hyuezct.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1781026918326-iaHKY2NySW0AA3WFpjpg.jpg" controls playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> Anthropic 推出 Claude Fable 5 模型，強調其具備高度自主性與安全性，旨在協助處理複雜的跨領域任務。

**核心產品定位與安全性**
Claude Fable 5 是 Anthropic 迄今效能最強大的模型，在軟體工程、知識工作、科學研究及視覺處理等領域的測試基準上均達到業界頂尖水準。為了在釋放強大能力的同時降低濫用風險，Anthropic 為其導入了嚴謹的安全防護機制：
- 若使用者查詢涉及網路安全、生物學、化學或模型蒸餾等高風險議題，系統會自動將任務轉導至次一級的「Claude Opus 4.8」模型處理。
- 該防護機制目前觸發率平均低於 5%，Anthropic 表示未來將持續精進以減少誤判（False Positives）。

**專屬防護與專業應用**
針對網路安全防禦者與關鍵基礎設施提供者，Anthropic 同步推出了「Claude Mythos 5」。
- 該模型與 Fable 5 使用相同的底層架構，但解除了部分領域的安全限制。
- 目前 Mythos 5 僅開放給「Project Glasswing」合作夥伴使用，未來將透過更廣泛的「信任存取計畫」（Trusted Access Program）擴大開放範圍。
- 兩款模型的定價均為輸入每百萬 token 10 美元、輸出每百萬 token 50 美元，價格僅為先前 Claude Mythos Preview 的一半。

**關鍵效能表現**
根據官方測試與早期企業回饋，Fable 5 在處理長時程、高複雜度任務時表現尤為突出：
- **軟體工程**：在 Stripe 的測試中，Fable 5 成功將數月的工程任務壓縮至數日內完成，並在 5,000 萬行的 Ruby 程式庫中執行了大規模遷移。在 Cognition 的 FrontierCode 評測中，其程式碼品質與執行效率均領先其他前沿模型。
- **知識工作與推理**：在 Hebbia 的金融基準測試中，Fable 5 在文件推理、圖表解析及問題解決能力上獲得最高分。
- **視覺處理**：Fable 5 展現了極高的視覺理解力，不僅能從科學圖表中精確提取數據，甚至能僅憑螢幕截圖重建網頁應用程式的原始程式碼。
- **自主研究**：Mythos 5 在生命科學領域展現了驚人的自主性，能獨立執行蛋白質設計任務，甚至在分子生物學研究中提出了具備實驗價值的原創假說。此外，它在基因組學研究中，僅需高層級的人類輸入，便能自主完成數據組裝與機器學習模型訓練，效能超越了發表於《科學》（Science）期刊的近期研究模型。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1781026840378-EWMAAJanXpngnameorig.png)
> Claude Fable 5 在幾乎所有測試的基準測試中皆達到領先水準（SOTA），在軟體工程、知識工作、科學研究和視覺領域表現尤為優異。

**未來展望**
Anthropic 強調，Fable 5 與 Mythos 5 的推出是為了在確保安全的前提下，儘快將先進 AI 能力普及至更多使用者。隨著未來幾個月內更強大模型的到來，公司將持續優化安全防護機制，並透過「Project Glasswing」等計畫，進一步推動 AI 在網路防禦與生物醫學研究中的正面應用。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1781026838013-izmmsm9v.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1781026840235-iaHKY5eixXIAE9EAZjpg.jpg" controls playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> 這是一段展示「Fable 5」主題的創意視覺短片，透過拼貼各種自然科學插圖與歷史地圖，巧妙地以數字「5」為核心進行視覺轉場。

**小提醒**
訂閱方案（Pro/Max/Team）只免費(消耗訂閱週限額）到 6/22，6/23 起需使用 usage credits 。

## 媒體內容

**這是一段展示「Fable 5」主題的創意視覺短片，透過拼貼各種自然科學插圖與歷史地圖，巧妙地以數字「5」為核心進行視覺轉場。**

**影片中的 Prompt 與操作**

操作步驟：

1. @00:09 將地圖剪裁拼貼成數字「5」
2. @00:10 將便利貼排列成數字「5」
3. @00:11 在電路板上以元件排列出數字「5」
4. @00:12 將星空中的星星連線構成數字「5」
5. @00:13 在培養皿中以菌落生長出數字「5」

**Claude Fable 5 在幾乎所有測試的基準測試中皆達到領先水準（SOTA），在軟體工程、知識工作、科學研究和視覺領域表現尤為優異。**

**數據表**

|   | Claude Mythos 5 / Fable 5 | Claude Mythos Preview | Claude Opus 4.8 | GPT 5.5 | Gemini 3.1 Pro |
| --- | --- | --- | --- | --- | --- |
| Agentic coding (SWE-Bench Pro) | 80.3% | 77.8% | 69.2% | 58.6% | 54.2% |
| Agentic coding (FrontierCode (Diamond)) | 29.3% (xhigh) | — | 13.4% (xhigh) | 5.7% (xhigh) | — |
| Knowledge work (GDPval-AA) | 1932 | — | 1890 | 1769 | 1314 |
| Knowledge work vision (GDP.pdf) | 29.8% (no tools) | — | 22.5% (no tools) | 24.9% (no tools) | 16.7% (no tools) |
| Spatial reasoning (Blueprint-Bench 2) | 38.6% | — | 14.5% | 36.2% | 26.5% |
| Tool use (AutomationBench) | 17.4% | — | 15.5% | 12.9% | 9.6% |
| Computer use (OSWorld-Verified) | 85.0% | 85.4% | 83.4% | 78.7% | 76.2% |
| Legal (Legal Agent Benchmark) | 13.3% | — | 10.4% | 2.1% | 0.0% |
| Multidisciplinary reasoning (Humanity's Last Exam - no tools) | 59.0%* (no tools) | 56.8% (no tools) | 49.8% (no tools) | 41.4% (no tools) | 44.4% (no tools) |
| Multidisciplinary reasoning (Humanity's Last Exam - with tools) | 64.5%* (with tools) | 64.7% (with tools) | 57.9% (with tools) | 52.2% (with tools) | 51.4% (with tools) |
| Biology (BioMysteryBench - hard) | 46.1%* (hard) | 29.6% (hard) | 40.0% (hard) | — | — |
| Biology (BioMysteryBench - human solved) | 83.9%* (human solved) | 82.6% (human solved) | 80.4% (human solved) | — | — |
| Agentic coding (Terminal-Bench 2.1) | 88.0%* | — | 82.7% | 83.4% (Codex CLI) | 70.7% (Gemini CLI) |
| Cybersecurity (ExploitBench (Cap%)) | 78.0%* | 69.0% | 40.0% | 34.0% | — |
| Health (HealthBench Professional) | 66.0%* | 64.7% | 56.9% | 51.8% | — |

**Anthropic 推出 Claude Fable 5 模型，強調其具備高度自主性與安全性，旨在協助處理複雜的跨領域任務。**

**影片中的 Prompt 與操作**

操作步驟：

1. @00:06 標記 Fable 系列模型名稱。
2. @00:17 展示模型發現漏洞的網格圖表。
3. @00:55 展示安全系統自動審核高風險請求。
4. @01:00 展示將高風險請求從 Fable 5 重新導向至 Opus 4.8 的流程。

**逐字稿**

- `00:00` 今天我們推出了 Claude Fable 5，這是我們有史以來發布過最強大的模型。（Today we're launching Claude Fable 5, the most capable model we've ever released to the public.）
- `00:05` Fable 5 是一款 Mythos 等級的模型，具備完善的保護機制，已準備好供大眾使用。（Fable 5 is a Mythos class model with safeguards that make it ready for general use.）
- `00:10` 我們之前並沒有廣泛發布具備這種能力等級的模型，因為當我們完成訓練與測試後，發現該模型 Claude Mythos Preview 找出了數千個網路安全漏洞。（We didn't broadly release our previous model with this level of capability, because when we finished training and testing it, we saw that the model, Claude Mythos Preview, was finding thousands of cybersecurity vulnerabilities.）
- `00:22` 一個能找出這類缺陷的模型，同樣也能被用來利用這些缺陷。（A model that can find flaws like that can also be used to exploit them.）
- `00:25` 因此，我們沒有直接發布它，而是將其交給了負責保護全球關鍵軟體的人員。（So instead of releasing it, we handed it to the people who protect the world's critical software.）
- `00:30` 並讓它在有人利用這些漏洞進行破壞之前，先投入修補工作。（And put it to work fixing the holes before someone could break through them.）
- `00:33` 這在當時是正確的決定，但這從來都不是我們的最終目標。（It was the right call for the moment, but it was never the goal.）
- `00:37` 我們相信強大的人工智慧應該是安全且易於取得的。（We believe powerful AI should be safe and accessible.）
- `00:40` 這就是為什麼我們著手開發 Claude Fable 5。（That's why we went to work on Claude Fable 5.）
- `00:44` 每一個 Claude 模型都具備保護機制，以防止其造成危害。（Every Claude model has safeguards to keep it from doing harm.）
- `00:47` Fable 需要比我們以往開發的任何模型更謹慎的保護機制。（Fable needed more cautious ones than anything we'd built before.）
- `00:51` 我們針對 Fable 5 的安全系統會自動審查涉及網路安全或生物學等高風險領域的請求。（Our safety systems for Fable 5 automatically review requests that touch on high-risk areas like cybersecurity or biology.）
- `00:59` 這些請求隨後會被重新導向至 Opus 4.8。（Those requests are then redirected to Opus 4.8.）
- `01:02` 我們刻意這麼做，是為了讓使用者在享受 Fable 這類強大模型帶來的能力時，不必承擔隨之而來的網路與生物安全風險。（We do that intentionally, so people can continue to benefit from the capabilities of a powerful model like Fable, without the cyber and biology risks that come with it.）
- `01:11` 這些保護機制目前範圍較廣，但我們會持續優化，以便能更精準地放行安全的請求。（The safeguards are broad today, but we'll keep refining them so that they're better at allowing safe requests.）
- `01:17` 我們為您最具野心的專案打造了 Claude Fable 5。（We built Claude Fable 5 for your most ambitious work.）
- `01:20` 它能針對問題進行比以往任何模型更長時間的深入研究。（It can stay with a problem far longer than any model before it.）
- `01:23` 它具備高度自主性，可以在無人介入的情況下運作數天。（It's highly autonomous and can operate for days without intervention.）
- `01:26` 而且它不僅限於程式撰寫，還能處理金融、研究、經濟、法律等領域的專案，以及過去需要持續監督的複雜任務。（And it's not just coding, it can take on projects in finance, research, economics, law, complicated tasks that used to need constant supervision.）
- `01:36` 所以，將它應用在真正重要的事情上吧。（So point it at something that matters.）
- `01:38` 回首過去，有哪些問題會讓我們納悶為什麼花了這麼久才解決？（What's the problem we'll look back on and wonder why it took so long to solve?）
- `01:42` 我們了解 Claude Fable 5 的能耐。（We know what Claude Fable 5 can do.）
- `01:44` 最令人期待的是，您將會用它創造出什麼成果。（The interesting part is what you'll do with it.）

## 標籤

Claude, LLM, Anthropic, Claude, Fable
