# 策展 · X (Twitter) 🔥🔥🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Sakana AI (@SakanaAILabs) · 平台：X (Twitter) · 日期：2026-06-22

> 原始來源：https://x.com/SakanaAILabs/status/2068861630327443966

## 中文摘要

Sakana AI 推出 Sakana Fugu 實現任務自動化。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1782105995408-gk2b59ln.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/acb394d3f8a437b0.jpg" autoplay loop muted playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> 這是一段展示 sakana.ai 品牌標誌與「sakana fugu」名稱演變的動態視覺演示。

**核心產品與定位**
Sakana AI 發布的「Sakana Fugu」是一套將多 Agent 編排系統封裝為單一基礎模型的解決方案。該系統旨在解決企業對於單一模型供應商的依賴風險，特別是在面對如「Fable」或「Mythos」等模型遭遇出口管制時，Sakana Fugu 透過動態調度底層可替換的 Agent 池，確保關鍵基礎設施與業務運作的韌性。使用者僅需呼叫單一 OpenAI 相容的 API，即可存取這套具備集體智慧的編排系統，無需處理複雜的多 Agent 協作邏輯。

**技術架構與運作機制**
Sakana Fugu 本身即為一個大型語言模型，經過專門訓練以執行 Agent 池中的各類模型呼叫，甚至能遞迴呼叫自身。其技術基礎源自 ICLR 2026 發表的兩篇研究論文：`TRINITY` 與 `The Conductor`，這些研究展示了系統如何學習組裝、路由並協調專家 Agent，而非依賴人工設計的固定工作流。
- 系統會自動管理模型選擇、任務委派、結果驗證與最終合成。
- 當任務簡單時，Fugu 會直接處理；若任務複雜，則會自動組建專家團隊進行協作。
- 該系統支援彈性調整，使用者可選擇將特定 Agent 從池中剔除，以符合資料隱私或合規性要求。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/3efe9630be4765aa.png)
> 此圖表展示了 Sakana Fugu 如何從 LLM Pool 中整合多種封閉與開放模型，並進一步衍生出 Sakana Fugu 模型的架構概念。

**模型版本與應用場景**
Sakana Fugu 於發布時提供兩種版本，均透過單一 API 存取：
- **Fugu**：定位為日常工作預設模型，平衡了高效能與低延遲，適用於程式撰寫（如整合至 Codex）、聊天機器人及互動式服務。
- **Fugu Ultra**：旗艦版本，專為高難度、多步驟任務調校，協調更深層的專家 Agent 池，適用於 AI 研究、網路安全分析、專利調查及論文重現等高門檻領域。

**實際效能與產業影響**
根據 Sakana AI 的測試，Fugu Ultra 在工程、科學與推理基準測試中，表現與「Fable 5」及「Mythos Preview」等頂尖模型相當。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/bd1c85848de3e2d7.jpg)
> Sakana AI 推出的 Fugu Ultra 模型在多項基準測試中展現出與 Fable 5 和 Mythos Preview 相當的前沿性能表現。

 在 Beta 測試階段，近 500 名使用者將其應用於自動化資料科學研究與程式碼審查，回饋顯示該系統在處理長週期、複雜且混亂的真實世界工作流時，能展現出優於單一模型的持續進展能力。Sakana AI 強調，隨著生態系中新模型的出現，他們將持續擴充 Fugu 的 Agent 池，確保使用者能隨時獲得最新的技術紅利，實現真正的 AI 主權。

## 媒體內容

**這是一段展示 sakana.ai 品牌標誌與「sakana fugu」名稱演變的動態視覺演示。**

**影片中的 Prompt 與操作**

操作步驟：

1. （00:00）顯示 sakana.ai 品牌標誌
2. （00:05）動畫開始，魚形圖案匯聚
3. （00:11）顯示 sakana.ai 文字
4. （00:12）顯示 sakana 文字
5. （00:13）顯示 sakana fugu 文字

**Sakana AI 推出的 Fugu Ultra 模型在多項基準測試中展現出與 Fable 5 和 Mythos Preview 相當的前沿性能表現。**

**數據表（1）LiveCodeBench**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 93.2 |
| Fugu | 92.9 |
| Fable 5 | 89.8 |
| Gemini 3.1 Pro | 88.5 |
| GPT 5.5 | 85.3 |
| Opus 4.8 | 87.8 |

**數據表（2）GPQA-D**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 95.5 |
| Fugu | 95.5 |
| Mythos Preview | 94.6 |
| Gemini 3.1 Pro | 94.3 |
| GPT 5.5 | 93.6 |
| Opus 4.8 | 92.0 |

**數據表（3）CharXiv Reasoning**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 86.6 |
| Fugu | 85.1 |
| Mythos Preview | 86.1 |
| Gemini 3.1 Pro | 83.3 |
| GPT 5.5 | 84.1 |
| Opus 4.8 | 84.2 |

**數據表（4）SWEBench Pro**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 73.7 |
| Fugu | 59.0 |
| Fable 5 | 80.0 |
| Gemini 3.1 Pro | 54.2 |
| GPT 5.5 | 58.6 |
| Opus 4.8 | 69.2 |

**數據表（5）SciCode**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 58.7 |
| Fugu | 60.1 |
| Fable 5 | 60.2 |
| Gemini 3.1 Pro | 58.9 |
| GPT 5.5 | 56.1 |
| Opus 4.8 | 53.5 |

**數據表（6）Humanity's Last Exam (text)**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 50.0 |
| Fugu | 48.5 |
| Fable 5 | 53.3 |
| Gemini 3.1 Pro | 44.7 |
| GPT 5.5 | 44.3 |
| Opus 4.8 | 45.7 |

**數據表（7）Terminal Bench 2.1**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 82.1 |
| Fugu | 80.2 |
| Fable 5 | 80.4 |
| Gemini 3.1 Pro | 70.3 |
| GPT 5.5 | 78.2 |
| Opus 4.8 | 74.6 |

**數據表（8）CTI-REALM**

| 模型 | 分數 |
| --- | --- |
| Fugu Ultra | 69.4 |
| Fugu | 67.5 |
| Mythos Preview | 68.5 |
| Gemini 3.1 Pro | 56.0 |
| GPT 5.5 | 67.3 |
| Opus 4.8 | 69.6 |

## 標籤

Agent, 自動化, 新產品, Sakana AI
