# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：OpenRouter (@OpenRouter) · 平台：X (Twitter) · 日期：2026-06-15

> 原始來源：https://x.com/OpenRouter/status/2065856853989270011

## 中文摘要

OpenRouter 推出 Fusion API 實現深度研究效能。

**核心概念與運作機制**
OpenRouter 發布的「Fusion」是一項伺服器端工具，旨在透過「多模型審議」（Multi-model deliberation）提升複雜任務的處理品質。當使用者發送提示詞（prompt）至 Fusion 時，系統會執行以下流程：
1. **並行處理**：將任務分發給一組模型（Panel），每台模型均配備網路搜尋與 Bash 工具。
2. **審議分析**：由一名「評審模型」（Judge model）讀取所有回應，並提取結構化分析，包含共識點、矛盾處、獨特見解及盲點。
3. **最終合成**：由合成器根據上述分析撰寫最終答案。

**效能表現與基準測試**
根據 OpenRouter 在「DRACO」深度研究基準測試（包含法律、醫學、金融等 10 個領域的 100 項任務）的評估結果：
- **超越單一模型**：由多個模型組成的面板，其表現穩定優於單一模型。
- **成本效益**：由「Gemini 3 Flash」、「Kimi K2.6」與「DeepSeek V4 Pro」組成的預算型面板，其效能擊敗了單一的 GPT-5.5 與 Opus 4.8，且僅需約一半的成本，表現甚至逼近 Claude Fable 5。
- **合成效應**：測試顯示，Fusion 帶來的效能提升中，約四分之三來自「合成」過程，四分之一來自「模型多樣性」。即便是將同一模型（如 Opus 4.8）與自身配對進行合成，效能亦有顯著提升。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/8734b4c32580a5dd.jpg)
> 根據 OpenRouter 的基準測試，模型融合面板（Fusion panel）的表現普遍優於單一模型（Solo model），其中由 Gemini 3 Flash、Kimi K2.6 與 DeepSeek V4 Pro 組成的平價融合面板，其表現（約 64.7%）不僅超越了單一的 GPT-5.5 與 Opus 4.8，且與頂尖的 Claude Fable 5 單一模型相差不到 1%。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/bba69616f4e5c1d8.jpg)
> 測試結果顯示，相較於單獨運行的 Opus 4.8，透過 Fusion 結合多個模型能顯著提升表現，其中同模型組合（Opus 4.8 + Opus 4.8）藉由合成（Synthesis）獲得 +6.7% 的提升，而跨模型組合（Opus 4.8 + GPT-5.5）則能進一步結合多樣性（Diversity）獲得額外 +2.1% 的提升。

**開發者整合方式**
開發者可透過兩種主要方式調用 Fusion：
1. **直接呼叫**：將模型名稱設定為 `openrouter/fusion`。
2. **工具調用**：在 `tools` 陣列中加入 `{"type": "openrouter:fusion"}`，讓模型自行決定何時需要多模型協作。

若需自訂面板模型或評審模型，可於工具參數中指定：

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/c57dc05c5e0795ef.png)
> 這是一段顯示「fusion」外掛程式設定的 JSON 程式碼片段，其中定義了模型與分析模型列表。

```json
{
  "tools": [
    {
      "type": "openrouter:fusion",
      "parameters": {
        "analysis_models": [
          "~google/gemini-flash-latest",
          "deepseek/deepseek-v3.2",
          "~moonshotai/kimi-latest"
        ],
        "model": "~anthropic/claude-opus-latest"
      }
    }
  ]
}
```

**注意事項與限制**
- **防弊機制**：OpenRouter 在測試中發現模型會搜尋到 DRACO 的評分標準，因此已在搜尋設定中排除相關網域，確保測試數據的純淨性。
- **適用場景**：Fusion 適用於需要多重觀點的研究、比較或複雜批判任務，不建議用於簡單的戰術性指令。
- **未來展望**：目前 Fusion 尚未針對長程任務（Long-horizon tasks）進行基準測試，OpenRouter 表示這將是未來研究的重點。

詳細技術文件與互動測試可參考 [OpenRouter Fusion 文件](https://openrouter.ai/docs/guides/features/server-tools/fusion) 與 [Fusion 聊天室](https://openrouter.ai/fusion)。

## 媒體內容

**根據 OpenRouter 的基準測試，模型融合面板（Fusion panel）的表現普遍優於單一模型（Solo model），其中由 Gemini 3 Flash、Kimi K2.6 與 DeepSeek V4 Pro 組成的平價融合面板，其表現（約 64.7%）不僅超越了單一的 GPT-5.5 與 Opus 4.8，且與頂尖的 Claude Fable 5 單一模型相差不到 1%。**

**數據表**

| 項目 | 數值 |
| --- | --- |
| Fable 5 + GPT-5.5 (fusion) | 約 69% |
| Opus 4.8 + GPT-5.5 + Gemini 3.1 Pro (fusion) | 約 68.3% |
| Opus 4.8 + GPT-5.5 (fusion) | 約 67.6% |
| Opus 4.8 + Opus 4.8 (self-fusion) | 約 65.5% |
| Claude Fable 5 (solo) | 約 65.3% |
| Gemini 3 Flash + Kimi K2.6 + DeepSeek V4 Pro (fusion) | 約 64.7% |
| DeepSeek V4 Pro (solo) | 約 60.3% |
| GPT-5.5 (solo) | 約 60% |
| Claude Opus 4.8 (solo) | 約 58.8% |
| Kimi K2.6 (solo) | 約 53.7% |
| Gemini 3.1 Pro (solo) | 約 45.4% |
| Gemini 3 Flash (solo) | 約 43.1% |

**測試結果顯示，相較於單獨運行的 Opus 4.8，透過 Fusion 結合多個模型能顯著提升表現，其中同模型組合（Opus 4.8 + Opus 4.8）藉由合成（Synthesis）獲得 +6.7% 的提升，而跨模型組合（Opus 4.8 + GPT-5.5）則能進一步結合多樣性（Diversity）獲得額外 +2.1% 的提升。**

**數據表**

|   | Baseline score |
| --- | --- |
| Opus 4.8 solo | 58.7% |
| Opus 4.8 + Opus 4.8 | 58.7% |
| Opus 4.8 + GPT-5.5 | 58.7% |

## 標籤

新產品, 功能更新, LLM, Benchmark, OpenRouter
