# 策展 · X (Twitter) 🔥🔥🔥

> 作者：Ashpreet Bedi (@ashpreetbedi) · 平台：X (Twitter) · 日期：2026-05-13

> 原始來源：https://x.com/ashpreetbedi/status/2054222428025614829

## 中文摘要

# 能自我建構的 Agent 平台

每個開發 Agent 的團隊，最後都會發現自己必須從零開始打造一個 Agent 平台。

現在，具備 Agentic 程式開發能力的 Agent 已經能處理這些工作了。今天，我將分享如何建構一個完全由 Agent 負責開發、管理與優化的 Agent 平台。

整個 Agent 開發生命週期透過五個 Prompt 來管理：

- **Create（建立）**：建構一個新的 Agent 雛形。
- **Improve（優化）**：根據 Agent 自身的規格要求，強化現有的 Agent。
- **Extend（擴充）**：為現有的 Agent 增加新功能。
- **Hill Climb（爬坡優化）**：執行評測套件（eval suite）、診斷故障，並修復範圍內的錯誤。
- **Review（審查）**：掃描整個程式庫，檢查文件、程式碼與設定檔之間是否出現偏差。

# 什麼是 Agent 平台

假設你已經用你最喜歡的框架建立了一個 Agent，你要如何讓它正式上線？如何將它部署到雲端、發送請求給它，並確保其安全性？

你的 Agent 平台就是負責執行 Agent 的服務。它負責接收請求、執行 Agent 並串流輸出回應。它會收集資料與指標、透過防止未經授權的存取來管理安全性，並阻止某個 Agent 存取或污染另一個 Agent 的資料。

如果你將 Agent 視為微型應用程式（mini-applications），就會發現它們需要一個執行系統，就像作業系統（OS）一樣。而你的 Agent 平台就是那個作業系統。

# 我們要建構什麼

今天，我們將建構一個可以透過 Docker 在本地執行、在你的雲端執行，或使用單一指令在 Railway 上部署的 Agent 平台。該平台包含五個部分：

1. **Runtime（執行時期）**：執行 Agent 的服務。它處理請求、執行 Agent 迴圈、串流回應、寫入儲存空間並處理驗證。
2. **Storage（儲存）**：存放資料的資料庫，包含 Agent 的對話紀錄（sessions）、記憶、知識庫、追蹤紀錄（traces）與評測歷史。
3. **Connectors（連接器）**：讓 Agent 透過 MCP、API 或 CLI 與外部系統連接的工具。將這些工具集中管理對安全性有極大幫助。
4. **Interfaces（介面）**：支援 Slack、Discord、Telegram 或自訂 UI。這能統一處理跨平台的身份識別，確保同一個人無論是在 Slack 傳訊息給你，還是透過網頁應用程式存取，都對應到同一個 `user_id`。
5. **Infrastructure（基礎設施）**：執行所有程式的地方。我們將使用 Docker 進行本地開發，並使用 Railway 進行生產環境部署。你也可以自由選擇在任何地方部署生產環境。

一旦平台運作起來，你應該能在約 10 分鐘內發布一個新的 Agent，而且完全不需要撰寫任何程式碼。我知道這聽起來很瘋狂，讓我們試試看。

# 開始動手

我將分享一個你可以基於此進行開發的基礎程式庫。

複製、設定並執行：agent-platform-railway

```bash
# 複製 agent-platform 模板
git clone https://github.com/agno-agi/agent-platform-railway.git agent-platform
cd agent-platform

# 設定你的環境
# 建議：複製範例環境檔案並加入你的金鑰
cp example.env .env
# 編輯 .env 並加入你的 OPENAI_API_KEY

# 執行你的平台：包含 1 個 FastAPI 伺服器與 1 個 Postgres 資料庫
docker compose up -d --build
```

這會啟動兩個容器：一個 FastAPI 伺服器和一個 Postgres 資料庫。

現在，讓我們為平台加上 UI。

1. 前往 os.agno.com 並登入。
2. 連接到你的本地 OS，網址為 http://localhost:8000。

你應該會看到類似這樣的畫面：

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778638710098-iaHIGPx1oa4AI9I7Djpg.jpg)

# Agent 開發生命週期

因為所有東西都集中在同一個地方，Claude Code 可以管理我整個 Agent 的開發生命週期。

## 1. 建立 Agent

要建立一個新的 Agent，我會開啟 Claude Code 並輸入：

> Run create-new-agent.md in a new branch.

Claude 會先詢問幾個關於 Agent 功能與所需工具的問題。接著，它會透過 MCP 搜尋 Agno 文件以找到合適的工具組，產生 Agent 檔案，在 `app/main.py` 中註冊它，重啟容器，並透過 cURL 進行冒煙測試（smoke-test）。從 Prompt 到 Agent 完成只需要 5-10 分鐘。

## 2. 優化 Agent

要優化現有的 Agent，我輸入：

> Run improve-agent.md on code-search agent.

Claude 會讀取該 Agent 的 INSTRUCTIONS（指令），並從中推導出 8-12 個測試探針（probes）。有些是針對正常路徑（golden-path），有些是邊緣案例（edge cases），有些是工具選擇測試，還會加入幾個對抗性測試：例如 Prompt 注入、格式錯誤的輸入，以及試圖讓 Agent 偏離目標的嘗試。

它會透過 cURL 對執行中的容器執行每個探針，讀取回應，並從容器日誌中讀取工具呼叫紀錄。接著，它會根據 INSTRUCTIONS 的承諾來判斷 PASS 或 FAIL。

對於每一次失敗，它都會選擇一個槓桿點進行調整：收緊規則、新增規則、更換工具、增加 `num_history_runs` 等。無論是什麼原因導致失敗，它都會編輯 `agents/<slug>.py`，進行熱重載（hot-reload），並只重新執行那些失敗的探針。

除了啟動任務之外，我不需要進行任何額外操作。這項工作過去需要花一整天手動點擊測試，現在已經完全自動化了。

## 3. 擴充 Agent

要為現有的 Agent 增加功能，我輸入：

> Run extend-agent.md on code-search agent.

Extend 會在我的引導下執行。我描述變更需求：新增一個工具、優化 Prompt 或修復 Bug。Claude 負責執行。由於 Agno 文件 MCP 已經載入，工具組的研究是基於真實 API 的。

## 4. 爬坡優化（Hill Climb）

隨著時間推移，我們收集了大量的評測資料，如果還要手動修復失敗會很可惜。我只需輸入：

> Run eval-and-improve.md.

Hill Climb 會執行評測套件，診斷每一個失敗，並修復範圍內的錯誤。

## 5. 審查（Review）

由於程式庫主要由 Agent 管理，開發速度非常快。為了讓所有內容保持同步，我輸入：

> Run review-and-improve.md.

Claude 會掃描整個程式庫，檢查文件、程式碼與設定檔之間是否存在偏差，並修復它能處理的部分。建議在發布前或重構後執行此操作。

文件與程式碼之間的偏差長期以來一直是生產軟體的一種隱形成本，現在則完全不需要付出代價。

# 生產環境部署

當你準備好發布時，程式庫中已包含部署到 Railway 的腳本：

```bash
./scripts/railway/up.sh
```

這會在同一個私有網路中配置 Postgres 與應用程式服務。

請閱讀 README 中的完整 Railway 指南。

# 總結

恭喜你。如果你讀到這裡，你已經在你的雲端中運行了一個可安全運作且能自我優化的 Agent 平台。

你團隊中的技術人員可以使用 Claude Code 來建立與部署 Agent，而非技術人員則可以使用無程式碼（no-code）的 UI。

對話紀錄、追蹤紀錄與知識庫都存放在你的資料庫中。你的基礎設施受到基於 JWT 的 RBAC 保護，且 API 金鑰統一管理。

你今天發布的 Agent 只是你所建構系統中最小的一部分。真正重要的是底下的平台，以及它所實現的迭代迴圈。

---

感謝閱讀。由 Agno 🧡 打造。

## 標籤

Agent, 自動化, 教學資源, Agent