# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Lee Robinson (@leerob) · 平台：X (Twitter) · 日期：2026-06-12

> 原始來源：https://x.com/leerob/status/2065469795529588940

## 中文摘要

# 打造遞迴式 Agent 系統

在 Cursor，我們運行數以千計的 Agent 來協助我們訓練下一版本的 Composer。

我們會指派研究任務給它們，如果它們執行失敗或遇到問題，它們會透過 Slack 私訊我們，或是透過 PagerDuty 發送通知。

## 擴展 Composer 的訓練規模

我們建立了一個由多個 Agent 組成的組織架構，讓它們協同工作。

隨著我們擴展 Composer 的訓練規模，我們希望能進行更多、數以千計的實驗。這在過去並非不可能，但速度緩慢且難以追蹤每個實驗的狀態。為了加快速度並實現工作平行化，我們建立了一個持續運行的 Agent 系統（沒錯，它就是一個迴圈）。

## 用於研究的 Agent 系統

這個系統的運作方式如下：

1. 主 Agent 運行在一台強大的遠端機器上，具備你在本機上會使用的所有工具，並在磁碟中設定一個檔案作為整個機群的「收件匣」。

2. 它透過 SSH 連線到運行數百個子 Agent 的機器，並將它們的狀態收集到收件匣中。

3. 在每個迴圈中，它會檢查機群的健康狀況，讓健康的任務在背景持續執行，並將任何故障資訊回報給 Slack 上的團隊。

4. 就像所有的基礎設施一樣，這些 Agent 有時會遇到暫時性的問題或需要人工介入，因此主 Agent 可以控制整個機群，並根據需要終止或重新啟動處理程序。

![一支智慧型手機顯示來自「P1 Composer Agent System」的系統警示通知，提示代理程式目前處於停滯狀態。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/ac866a347e479f21.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">畫面顯示一支智慧型手機的鎖定畫面通知中心，上方狀態列顯示時間為 9:41，訊號與電量圖示正常。畫面中央有一則推播通知，圖示為綠色背景搭配白色「P」字樣。通知內容如下：
- 標題：Alert: P1 Composer Agent System is stuck
- 內文：The agent is blocked and needs your input to continue with the next experiment.
- 時間標記：now

此畫面呈現一個自動化代理程式（Agent）在執行實驗過程中遇到阻礙，需要使用者介入處理的系統通知介面。</div></details>

這個「機群管理器」是建立在我們先前發表關於長期運行 Agent 的研究基礎之上。我們賦予了這個管理器許多不同的 skill，這些 skill 內化了執行機器學習實驗、審查與監控結果等方面的隱性知識。

## 擁有超能力的研究員

訓練出色的模型意味著要嘗試各種產生實用強化學習（RL）資料的點子。

單一台筆記型電腦是不夠的，你確實需要雲端上的一支電腦大軍來平行執行實驗。由於我們不受運算資源的限制，我們為機器學習團隊中的每個人都部署了這套基礎設施。

研究員的時間是我們最稀缺的資源，而我們找到了一種將他們影響力擴大數個數量級的方法。試想如果你有一位管理一萬名直屬下屬的人類經理，這顯然無法運作良好，但這種「人類 → Agent」的組織架構卻能發揮作用！

如果你面臨的問題是可以驗證的，且投入更多的 token 就能更快速或更有效地解決它，那麼考慮建立這樣的系統是值得的。它讓我們能夠擁有成群的 Agent，在 Composer 的資料中進行爬梳，並為未來的版本進行遞迴式的自我優化。

如果這聽起來讓你感到興奮，我們正在招募人才！

## 標籤

Agent, 自動化, IDE, Cursor
