# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Cognition (@cognition) · 平台：X (Twitter) · 日期：2026-06-30

> 原始來源：https://x.com/cognition/status/2071624568465490170

## 中文摘要

Cognition 推出 Devin Fusion 混合模型降低開發成本。

**核心技術架構**
Cognition 針對傳統模型路由在實際程式開發中表現不佳的問題，開發了 Devin Fusion。這套系統並非單純依賴基準測試分數，而是透過以下兩項關鍵技術，確保產出的程式碼具備實際合併至生產環境的品質：

- **「sidekick」代理模式**：系統同時運行兩個並行的 Agent。一個為負責規劃、處理模糊需求與最終審查的「frontier agent」，另一個則是負責執行具體任務的「sidekick」代理。這種架構讓主 Agent 能專注於高層次決策，同時將繁瑣任務委派給成本效益更高的 sidekick，避免過度消耗昂貴的 frontier 模型資源。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/ae8aa0d4258eb2e8.jpg)
> 此流程圖展示了「Main Agent」與「Sidekick」兩個角色在軟體開發任務中，透過程式碼探索、規劃、編寫、審查及除錯等步驟進行協作的運作機制。

- **動態中途路由（Dynamic Mid-Session Routing）**：工程任務的複雜度往往在執行過程中才會顯現。Devin Fusion 透過輕量級分類器，能在任務執行期間動態切換模型。特別是在「context compaction」（上下文壓縮）階段進行切換，能有效規避快取失效（cache miss）帶來的額外成本，實現幾乎無損的效能升級。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/c08361d1a1ef07be.jpg)
> 此圖展示了一個 AI 系統透過模型路由（Model Routing）機制，協調不同等級的模型分工執行程式碼修改與部署任務的流程範例。

**效能與實際應用**
根據 Cognition 內部針對「FrontierCode」基準測試的評估，Devin Fusion 在保持與頂尖模型同等效能的前提下，展現了顯著的成本優勢：

- 在使用 GPT-5.5 或 Opus 4.8 等模型時，Devin Fusion 成功降低了 35% 的運作成本。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/a1aec136806cb087.jpg)
> Devin Fusion 在 FrontierCode Extended 測試中，能以降低約 35% 的成本達到接近 Fable 5* 等級的智慧表現。

- 若搭配 Fable 5 模型，成本降幅更可達 41%。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/735865f253ae4b96.jpg)
> 根據 FrontierCode 擴展基準測試，Devin Fusion (Fusion + Fable 5) 取得了 57.6 的最高分，且每項任務的平均成本僅為 $3.00，相比 Fable 5 (medium) 降低了約 41% 的成本並提供同等甚至更優的性能。

- 內部測試顯示，88% 的合併 PR（Pull Request）完全由 Devin Fusion 的自動化路由機制驅動，證明其在真實開發場景中的穩健性。

**產業觀點與未來展望**
Cognition 指出，單一模型處理所有任務的時代即將結束，工程組織面臨的算力成本已達臨界點。透過混合模型 harness，開發者不僅能根據任務需求選擇最合適的模型，還能整合不同模型的強項（例如某些模型擅長 UI 測試，另一些則擅長除錯）。Devin Fusion 目前已正式整合至 Devin 平台，使用者可透過以下連結註冊體驗：

[Devin Fusion 試用註冊](http://app.devin.ai/signup?source=fusion_socials) 

欲深入了解該 harness 的工程細節與研究背景，可參考官方部落格：[Devin Fusion 技術說明](https://cognition.com/blog/devin-fusion)

## 媒體內容

**根據 FrontierCode 擴展基準測試，Devin Fusion (Fusion + Fable 5) 取得了 57.6 的最高分，且每項任務的平均成本僅為 $3.00，相比 Fable 5 (medium) 降低了約 41% 的成本並提供同等甚至更優的性能。**

**數據表**

|   | COST | SCORE |
| --- | --- | --- |
| Fusion + Fable 5 | $3.00 | 57.6 |
| Fable 5 (medium) | $5.12 | 57.0 |
| Opus 4.8 (high) | $3.24 | 48.8 |
| Fusion | $2.38 | 47.9 |
| GPT-5.5 (high) | $3.64 | 44.8 |
| GLM-5.2 | $2.70 | 43.0 |

**Devin Fusion 在 FrontierCode Extended 測試中，能以降低約 35% 的成本達到接近 Fable 5* 等級的智慧表現。**

**數據表**

|   | Fusion + Fable 5* | Fable 5* (點1) | Fable 5* (點2) | Fable 5* (點3) | Opus 4.8 (點1) | Opus 4.8 (點2) | Opus 4.8 (點3) | GPT-5.5 (點1) | GPT-5.5 (點2) | GPT-5.5 (點3) | GLM 5.2 |
| --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- | --- |
| Fusion = ($2.4, 48) | ($3.0, 57.5) | ($3.8, 54.3) | ($5.1, 57.0) | ($6.8, 59.0) | ($2.2, 43.0) | ($2.75, 45.5) | ($3.25, 48.7) | ($1.4, 38.7) | ($2.8, 42.3) | ($3.65, 44.8) | ($2.7, 43.0) |

## 標籤

Agent, 新產品, 功能更新, Cognition