← 返回首頁

一文理清!Hermes 全部高階工具配置

Researcher_王十三
Researcher_王十三
@ResearchWang
548🔁 108
𝕏 (Twitter)🔥🔥🔥

一文理清!Hermes 全部高階工具配置

Hermes 出來後發現並沒有太多人遷移過來,這次不像之前 OpenClaw 發布的時候,大家都在等,等更好的 Agent,等更好的模型。其實實際操作起來,後面即使出現更好的 Agent 也是一通百通的。

為了治好大家的拖延症,我把我實測的 Hermes 配置清單整理出來了。這套配置橫跨多個領域,直接從底層邏輯到實戰部署,告訴你每一個組件到底能幫你幹什麼。


推薦閱讀:我的 OpenClaw 到 Hermes 無痛遷移實錄


📚 目錄

  • 身份與記憶 — SOUL.md / 角色庫 / 記憶後端

  • 感知能力 — 內容抓取 / 網頁搜尋 / 瀏覽器自動化 / 文件處理

  • 表達能力 — 語音 / 圖片生成

  • 效率與成本 — token 監控 / 自我進化 / Skill 庫

  • 生態導航 — Hermes 資源入口


一. 身份與記憶

  1. 裝完 Hermes 第一件事不是用它,是告訴它「你是誰」

SOUL.md 是 Hermes 的人格文件,系統提示的第一個位置。但大多數人不知道怎麼寫?

我的做法是先從網上摘取一個模板,再慢慢和 Hermes 對話,每次對話完都會提醒 Hermes 對 SOUL.md 的文件進行修改、迭代。我用的是 agency-agents-zh。它裡面有 211 個中文角色模板,覆蓋小紅書營運、技術寫作、研究助手等場景。

agency-agents-zh: 211 個即插即用的 AI 專家角色 — 支援 Hermes Agent

211 個一個一個瀏覽太多了,可以用 GitHub 的搜尋,查找你要的領域、崗位名稱、所在平台。然後再在 Hermes 中說:「啟用 xxxx 模式」

# 安裝指令

https://github.com/jnMetaCode/agency-agents-zh 安裝這個儲存庫

# 啟用模式(以小紅書寫作模式為例子)

啟用小紅書內容寫作模式

  1. 記憶層面,雖然 Hermes 的記憶系統相比與 OpenClaw 做了不少提高,但 Hermes 內建的 MEMORY.md 也只記「模型主動寫下來的東西」。

換成 Hindsight 之後,它會自動從每次對話中提取實體和關係

你週一提了一個專案截止日期,週五新會話裡它自動記得,不需要重複

# 安裝指令
https://github.com/vectorize-io/hindsight 幫我在伺服器上部署 hindsight,並且當作 Hermes 的記憶系統

# 可以把自己的第三方 API 匯入,或者用 OpenAI
# 我用到是 DeepSeek 的 API

總結:

  • SOUL.md → agency-agents-zh(211+ 中文角色模板)

  • 記憶 → Hindsight(可以自建到伺服器上)


二. 感知能力

Agent 不能只和你聊天,它要能讀懂網際網路、吃掉文件、操作網頁

  • 內容抓取我用兩個工具組合:

Jina Reader:抓單頁 —— URL 前面加 r.jina.ai/ 就出乾淨 Markdown

Crawl4AI:深度抓取 —— 開源、本地執行、基於 Playwright,支援用本地模型做結構化提取,完全免費。

# 安裝指令
配置 https://github.com/jina-ai/reader 和 https://github.com/unclecode/crawl4ai
  • 繞過反爬(Cloudflare,驗證碼...)- 使用反爬代理和隱身瀏覽器

Hermes 自帶 Scrapling optional-skill,不需要再額外裝了

  • 隱身瀏覽器推薦 CamoFox 和 Browser Use

目前 Hermes 已經內建好了 Browser Use,我們只需要安裝 CamoFox 就好

# 安裝 camofox
幫我安裝 camofox,連結為:https://github.com/jo-inc/camofox-browser

  • 網頁搜尋用 Tavily

每月 1000 次免費,專為 AI Agent 設計,返回帶引用的結構化結果

再配置 DuckDuckGo 做零成本兜底

# 安裝 Tavily
# 1. 去 tavily.com 註冊,拿 API key(免費 1000 次/月)
https://app.tavily.com/sign-in

# 2. 寫入 Hermes 環境變數
echo 'TAVILY_API_KEY=tvly-你的key' >> ~/.hermes/.env

# 3. 設定搜尋後端
hermes config set web.backend tavily

# 在終端輸入,duckduckgo 是 Hermes 內建的瀏覽器搜尋引擎
hermes config set web.backend duckduckgo

  • 文件處理

格式轉化用 Pandoc:可將 PDF、DOCX、HTML、EPUB、LaTeX、CSV、reStructuredText、MediaWiki、OPML 轉成 Markdown、HTML、DOCX、PDF、EPUB、LaTeX、純文字...

PDF 轉 Markdown 效果差的話換 Marker

# 安裝 pandoc
幫我安裝 pandoc https://pandoc.org/installing.html#linux

# 
幫我安裝 marker,連結為:https://github.com/datalab-to/marker
 PDF 轉 Markdown 時使用 marker

推薦配置:

  • 單頁抓取 → Jina Reader(r.jina.ai)

  • 批次抓取 → Crawl4AI

  • 反爬 → Scrapling(Hermes optional-skill)

  • 搜尋 → Tavily(1000 次免費/月)+ DuckDuckGo 兜底

  • 瀏覽器 → Camofox(需要時才用)

  • 文件 → Pandoc + Marker


三. 表達能力

Agent 不只要能「看」,還要能「說」和「畫」

  • 語音辨識

Telegram 場景的剛需。辨識用 Whisper 本地模式,99 種語言,Telegram 語音訊息自動轉文字

合成用 Edge TTS,微軟免費,品質不差,Hermes 預設方案。兩個加一起零成本

# 安裝 whisper
 幫我安裝 whisper: https://github.com/openai/whisper
  • 圖片生成

用 Fal.ai, Midjourney, DALL-E 3

# Black Forest Labs 官方 FLUX Skill 
hermes skills install black-forest-labs/skills

# 匯入 FAL.ai 的 API-key

# 配置 FAL.ai, 去 fal.ai 註冊拿 key,有免費額度
echo 'FAL_KEY=你的key' >> ~/.hermes/.env


四. 效率與成本

  • 如果你需要知道 token 花在哪裡?

token 監控用 tokscale。一條指令 tokscale --hermes 看全域消耗

深度分析用 hermes-dashboard,社群成員做的 token 面板,能按組件拆解:系統提示佔多少、工具定義佔多少、訊息歷史佔多少

# tokscale
# tokscale --hermes 看全域消耗
連結: https://github.com/junhoyeo/tokscale

# hermes-dashboard
連結: https://github.com/Bichev/hermes-dashboard
  • 想減小 token 開銷的話

RTK(Rust Token Killer):能把終端指令的 token 消耗壓掉 80-90%

# RTK (Rust Token Killer)

https://github.com/adityahimaone/hermes-agent
  • 自我進化

等系統穩定兩週後再開。hermes-agent-self-evolution 用遺傳演算法自動優化 Hermes 的 prompt 和行為,但建議搭配一個驗證 cron——防止優化循環把你還沒調好的配置「優化」得更亂。

  • Skill 擴充

一次性裝 wondelai/skills(380+ 跨平台 skill)擴充基礎能力

再按需從 awesome-agent-skills(1000+ skills)裡挑

# skills 安裝
幫我安裝這個,連結為:https://github.com/wondelai/skills

五. 生態導航 — Hermes 資源彙總

收藏一個入口就夠了:awesome-hermes-agent 所有工具、skill、plugin、教學都在這裡

配套: