← 返回首頁

OpenAI工程師Ryan於倫敦演講中直指Harness Engineering核心:程式碼已免費,實施非瓶頸

𝕏 (Twitter)🔥
AI 中文摘要Claude 生成

OpenAI工程師Ryan於倫敦演講中直指Harness Engineering核心:程式碼已免費,實施非瓶頸,人類價值在於指導Agent執行。

Ryan在演講與訪談中強調,程式碼免費時代來臨,真正稀缺的是人類時間、注意力和模型上下文視窗,Harness Engineering的核心在於將人類經驗轉化為文本,讓Agent自行執行。

程式碼免費,守護欄稀缺
Ryan指出,模型已足夠強大,能如人類般撰寫完整程式碼。但人類時間與上下文視窗永遠稀缺,因此Harness的本質是將人類經驗(如品味、審核標準、非功能需求)全寫成文本,包括文件、技能、ADR與日誌,讓Agent隨時參考「什麼是好程式碼」。

賦予Agent完整工具與權限
傳統方法將Agent限制在預設腳手架中,逐步引導;Ryan反其道而行,讓Agent成為整個系統的核心,提供CLI、bash、觀測性堆疊,甚至自行啟動服務的能力。如此,Agent如全棧工程師般從頭到尾完成任務,人類僅需偶爾審核。

人類角色升級為編排者
工程師不再是「寫程式碼的人」,而是領導5000個Agent的staff engineer團隊領袖。主要工作包括:

  • 定義優先級與成功標準
  • 觀察Agent反覆錯誤
  • 將錯誤轉化為持久守護欄(如lints、tests、review Agent)
  • 持續解放人類時間至更高槓桿事務

Skills與漸進揭露機制
Ryan大力推崇skills,只將「名稱+描述」塞入上下文(僅數十token),需時再載入完整內容,既省token又提升Agent智慧。他團隊僅用5-10個核心skills,持續打磨,讓Agent如資深員工般理解團隊品味。

審核流程Agent化
PR不再需人類即時審核,他們用review Agent自動檢查程式碼(參照文件、守護欄、QA計劃)。人類僅在最終合併前抽樣審核,或post-merge後檢查。如此Agent可24/7並行運作,避免人類卡在審核瓶頸。

程式庫Agent友好設計
程式庫須盡量統一(one way to do X),建置時間壓至1分鐘內,文件結構清晰、套件隔離、觀測性內建,並用tests與lints驗證程式碼結構本身。如此Agent無論查看何處,皆能快速理解、減少錯誤。

Ryan總結,Harness Engineering非讓Agent代寫程式碼,而是解放人類脫離執行層,專注指導與編排;程式碼免費,prompt與守護欄才是王道。將團隊品味、標準、歷史經驗全寫成文本餵給Agent,即擁有24/7永不疲倦、持續進步的5000人工程團隊。