# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：mary (@howdymerry) · 平台：X (Twitter) · 日期：2026-04-08

> 原始來源：https://x.com/howdymerry/status/2041616469084270917

## 中文摘要

Hermes Agent Meta-Harness 透過優化運行時提升 AI Agent 效能。

「Hermes Agent Meta-Harness」是一個旨在優化 AI Agent 運行時（Runtime）的工具，透過外部迴圈搜尋最佳運行策略，而非直接調整模型權重。此專案解決了 Agent 因運行時效率低落、工具使用錯誤而導致的效能瓶頸。

**核心理念與問題解決**
許多程式撰寫 Agent 的失敗，往往源於運行時浪費了過多時間與 token 在基礎任務上，或是在錯誤的上下文中使用錯誤的工具。Meta-Harness 的核心觀點在於：AI 系統的品質不僅取決於模型權重，更取決於「Harness」（即圍繞模型的程式碼，負責上下文收集、儲存、檢索與呈現）。該專案填補了現有研究的空白，將基準測試 Harness 本身視為可優化的對象，而非僅僅優化模型。

**雙層架構設計**
為了確保研究過程的安全與穩定，該專案將系統拆分為兩個層次：
- `hermes-agent`（內層運行時）：負責候選協議、基準測試整合、迴圈掛鉤（hooks）與歸檔寫入。
- `hermes-agent-metaharness`（外層迴圈）：負責候選評估、歸檔分析、基準線重用、邊界追蹤與搜尋。

**優化範疇與限制**
該工具專注於透過「可驗證的基準測試」來優化運行策略，而非修改模型本身或讓生產環境的運行時進行自我修改。其優化範圍包含：
- 決定收集哪些引導（bootstrap）上下文。
- 決定暴露哪些工具及其呼叫順序。
- 設定允許的互動輪數。
- 選擇基準線進行比較與候選 Harness 的排序。

**實作與研究導向**
此專案目前採取保守的策略，透過對種子候選者進行確定性的包裝器（wrapper）變異來進行搜尋，而非直接重寫 Hermes 核心。它支援 TBLite 與 TB2 等程式撰寫基準測試，並提供完整的歸檔解析與報告功能。值得注意的是，這與「自我演化（self-evolution）」有顯著區別：自我演化旨在為 Agent 撰寫更好的指令，而 Meta-Harness 則旨在提升 Agent 在基準測試上的運行效率。

## 標籤

Agent, 開源專案, Hermes Agent, Meta-Harness
