# 策展 · X (Twitter) 🔥🔥

> 作者：Kangwook Lee (@Kangwook_Lee) · 平台：X (Twitter) · 日期：2026-05-10

> 原始來源：https://x.com/Kangwook_Lee/status/2052925157606568217

## 中文摘要

# 為什麼我們應該停止為 AI Agent 設計 harness

（對於不熟悉「馬車類比」的朋友，請先閱讀我最近發表的文章）

在這篇文章中，我想解釋為什麼我們都應該停止手動為 AI Agent 設計 harness。

> 簡而言之：AI Agent 最好的 harness 可能不再是人類為其設計的，而是 Agent 自己設計出來的。如果我們繼續為 AI Agent 設計 harness，我們將成為瓶頸。

讓我來解釋原因。

## Harness 創造了一個門檻

首先，讓我們提出一種關於 harness 與模型之間關係的新思考方式。

大多數人目前的觀點是：「修復模型，改變 harness。」

我想提出的觀點是：「固定 harness，改變模型能力。」

那麼，對於一個固定的任務，harness 會在模型的原始智慧上創造一個單一的門檻。

如果模型比這個門檻更聰明，它就能用這個 harness 解決任務。如果模型低於這個門檻，它就無法解決。

讓我們稱這個門檻為 θ(h)，它是針對 harness h 所定義的。

下圖捕捉了這個概念。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778375128178-iaHH1ukh9bUAAFcbWjpg.jpg)

# 

## 三種機制框架 (The Three Regimes Framework)

當我們需要比較兩個 harness 時，這個觀點就變得非常有用了。

一個是好的 harness (h_good)，另一個是壞的 harness (h_bad)。

好的 harness 讓任務變得更容易，因此它創造了一個較低的門檻。

壞的 harness 對同一個任務要求模型更聰明，因此它創造了一個較高的門檻。

這自然產生了三種機制。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778375128183-mediaHH1u6EbwAACPjpg.jpg)

第一種機制：處於此機制的模型無法透過任何一種 harness 解決任務。

第二種機制：處於此機制的模型智慧適中，它們可以解決任務，但前提是必須使用好的 harness！

第三種機制：處於此機制的模型足夠聰明，無論使用哪種 harness，它們都能解決任務。

請注意，當模型智慧適中但不是非常聰明時，harness 的品質在中間的機制就很重要。這就是為什麼好的 harness 能發揮作用。

讓我們稱之為「三種機制框架」。

## 人類製作的 harness vs. AI 製作的 harness

讓我們回到馬車的類比。

馬與 AI 之間有一個關鍵的區別。

> 馬無法建造自己的 harness，但 AI 可以。

現在，考慮這兩種 harness：

h_human：由人類製作的 harness。
h_ai：由 AI 製作的 harness。

在過去幾年中，情況是這樣的：

> h_good = h_human
h_bad = h_ai

人類製作的 harness 比 AI 製作的更好。

因此，在「三種機制框架」中，中間的機制意味著：「AI 模型只能在人類製作的 harness 下運作。」

我們精心手動設計的 Agent 迴圈、工具使用模式、記憶結構和規劃支架，表現都優於 AI 自己產出的結果。構建一個好的 Agent 意味著構建一個好的 harness。

我個人在這個時代花了很多時間為 AI Agent 設計 harness。我設計過最先進的聊天機器人 harness [ACL'23]、基於 VLM 的圖像聚類 Agent [ICLR'24]、PUBG 的遊戲夥伴 Agent [blog] Ally，以及用於程式開發 Agent 的 Terminus-KIRA [blog]。

這非常有趣。至少有一段時間是這樣。

但前提正在改變

AI 在程式撰寫方面變得越來越強。
在除錯方面表現更好。
在系統迭代上速度更快。
最終，在構建 harness 方面也比我們更強。

這翻轉了局勢。

> h_good = h_ai
h_bad = h_human

這意味著什麼？根據「三種機制框架」，中間的機制現在意味著：「AI 模型只能在 AI 製作的 harness 下運作。」

換句話說，如果我們繼續使用「人類製作的 harness」，我們將無法看到那些能力處於中間機制的模型發揮出全部潛力。

事實上，我們最近的工作 Meta Harness（由 @yoonholeee 領導）已經表明，在針對中型模型的迭代式 harness 工程中，AI 的表現已經超越了人類。

為了看清全貌，讓我加入一個時間軸。

假設 AI 的程式撰寫能力隨著時間推移單調增加。你會得到以下二維相圖，並看到我們正處於一個重要相變的邊緣。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778375128166-diaHH1y2tza4AAdX6jpg.jpg)

「黃色機制」的出現為 @a1zhang 和 @lateinteraction 提出的「被誤導的天才 (mismanaged geniuses)」假說提供了另一種可能的解釋。如果我們繼續使用手動設計的 harness，我們就無法看到底層 AI 模型的全部潛力。

## 結論

當模型極其強大時，harness 的品質幾乎無關緊要。簡單的 Agent 迴圈和正確的工具就足以處理幾乎所有事情。

當模型太弱時，harness 的品質也幾乎無關緊要。沒有任何 harness 能拯救它。

問題在於中間地帶。當模型智慧適中時，原則上是有能力的，但如果沒有適當的支援就會失敗。這就是 harness 品質起決定性作用的地方。

直到最近，好的 harness 還必須來自人類。

但現在不再是了。為了充分利用處於中間機制的模型，我們需要從 harness 工程中退後一步。

讓聰明的馬兒自己去建造牠們的 harness 吧。

## 標籤

Agent, 產業趨勢, AI Agent
