← 返回首頁

EvoSkill 透過自動化演算法提升程式開發 Agent 的效能

Anita AGI/acc
Anita AGI/acc
@Anitahityou
93🔁 12
𝕏 (Twitter)🔥🔥
AI 中文摘要Claude 生成

EvoSkill 透過自動化演算法提升程式開發 Agent 的效能。

EvoSkill 是一個與 Agent 無關的工具組,旨在透過自動化發現與優化技能,顯著增強程式撰寫 Agent 的能力,並已獲得學術論文引用。該工具透過自我演化機制,協助開發者將領域知識轉化為可複用的技能,進而提升 Agent 在複雜任務中的表現。

核心運作機制
EvoSkill 採用類似 GEPA 與 DSPy 的自我優化演算法,其運作邏輯與 Andrej Karpathy 的 autoresearch 專案相似。系統會自動執行以下循環:

  • 識別 Agent 的失敗模式。
  • 提出技能或提示詞(Prompt)的改進方案。
  • 評估變更後的效能。
  • 保留表現最佳的變更版本。

相容性與靈活性
該工具設計為與 Agent 無關(Agent-agnostic),可安裝於多種程式撰寫 Agent 中,並支援多種模型供應商與模型。

  • 支援的 Agent:Claude Code、OpenCode、OpenHands、Goose、Codex CLI。
  • 模型支援:使用者可自由選擇 Claude、GLM、Minimax、Kimi、GPT、Gemini、Qwen 等模型。

關鍵功能與特性
EvoSkill 強調技能的可遷移性與持續進化能力:

  • 基準測試進化:可針對自有或學術基準進行優化。
  • 跨平台遷移:技能被封裝為包含指令、元資料與輔助腳本的可重用資料夾,具備跨 Agent 的相容性。
  • 跨模型與跨任務遷移:在特定 LLM 上演化出的技能,可遷移至其他 LLM,且具備跨任務的通用性。

使用流程與版本控制
EvoSkill 透過 Git 分支管理程式版本,確保開發過程的安全與可追溯性,不會影響原始程式碼。

  • 初始化:透過 evoskill init 建立專案設定。
  • 任務定義:在 .evoskill/task.md 中描述 Agent 任務。
  • 執行迴圈:執行 evoskill run 進行自動化優化,並透過 evoskill eval 評估效能。
  • 版本管理:最佳程式版本會自動儲存於 Git 分支中。

實際應用場景
開發者指出 EvoSkill 可應用於多種場景,並分享了具體案例:

  • /brainstorming:在執行前結構化拆解問題,減少錯誤。
  • /skill-creator:將領域知識固化為可複用的 skill。
  • 實戰案例:開發者曾利用 EvoSkill 優化研究流程,對近期 BTC 走勢進行預測,預測 50% 可能在 $68K-$75K 區間震盪。