一文理清!Hermes 全部高階工具配置
一文理清!Hermes 全部高階工具配置
Hermes 出來後發現並沒有太多人遷移過來,這次不像之前 OpenClaw 發布的時候,大家都在等,等更好的 Agent,等更好的模型。其實實際操作起來,後面即使出現更好的 Agent 也是一通百通的。
為了治好大家的拖延症,我把我實測的 Hermes 配置清單整理出來了。這套配置橫跨多個領域,直接從底層邏輯到實戰部署,告訴你每一個組件到底能幫你幹什麼。

推薦閱讀:我的 OpenClaw 到 Hermes 無痛遷移實錄
📚 目錄
身份與記憶 — SOUL.md / 角色庫 / 記憶後端
感知能力 — 內容抓取 / 網頁搜尋 / 瀏覽器自動化 / 文件處理
表達能力 — 語音 / 圖片生成
效率與成本 — token 監控 / 自我進化 / Skill 庫
生態導航 — Hermes 資源入口
一. 身份與記憶
- 裝完 Hermes 第一件事不是用它,是告訴它「你是誰」
SOUL.md 是 Hermes 的人格文件,系統提示的第一個位置。但大多數人不知道怎麼寫?
我的做法是先從網上摘取一個模板,再慢慢和 Hermes 對話,每次對話完都會提醒 Hermes 對 SOUL.md 的文件進行修改、迭代。我用的是 agency-agents-zh。它裡面有 211 個中文角色模板,覆蓋小紅書營運、技術寫作、研究助手等場景。
agency-agents-zh: 211 個即插即用的 AI 專家角色 — 支援 Hermes Agent
211 個一個一個瀏覽太多了,可以用 GitHub 的搜尋,查找你要的領域、崗位名稱、所在平台。然後再在 Hermes 中說:「啟用 xxxx 模式」
# 安裝指令
https://github.com/jnMetaCode/agency-agents-zh 安裝這個儲存庫
# 啟用模式(以小紅書寫作模式為例子)
啟用小紅書內容寫作模式

- 記憶層面,雖然 Hermes 的記憶系統相比與 OpenClaw 做了不少提高,但 Hermes 內建的 MEMORY.md 也只記「模型主動寫下來的東西」。
換成 Hindsight 之後,它會自動從每次對話中提取實體和關係
你週一提了一個專案截止日期,週五新會話裡它自動記得,不需要重複
# 安裝指令
https://github.com/vectorize-io/hindsight 幫我在伺服器上部署 hindsight,並且當作 Hermes 的記憶系統
# 可以把自己的第三方 API 匯入,或者用 OpenAI
# 我用到是 DeepSeek 的 API

總結:
SOUL.md → agency-agents-zh(211+ 中文角色模板)
記憶 → Hindsight(可以自建到伺服器上)
二. 感知能力
Agent 不能只和你聊天,它要能讀懂網際網路、吃掉文件、操作網頁
- 內容抓取我用兩個工具組合:
Jina Reader:抓單頁 —— URL 前面加 r.jina.ai/ 就出乾淨 Markdown
Crawl4AI:深度抓取 —— 開源、本地執行、基於 Playwright,支援用本地模型做結構化提取,完全免費。
# 安裝指令
配置 https://github.com/jina-ai/reader 和 https://github.com/unclecode/crawl4ai
- 繞過反爬(Cloudflare,驗證碼...)- 使用反爬代理和隱身瀏覽器
Hermes 自帶 Scrapling optional-skill,不需要再額外裝了
- 隱身瀏覽器推薦 CamoFox 和 Browser Use
目前 Hermes 已經內建好了 Browser Use,我們只需要安裝 CamoFox 就好
# 安裝 camofox
幫我安裝 camofox,連結為:https://github.com/jo-inc/camofox-browser

- 網頁搜尋用 Tavily
每月 1000 次免費,專為 AI Agent 設計,返回帶引用的結構化結果
再配置 DuckDuckGo 做零成本兜底
# 安裝 Tavily
# 1. 去 tavily.com 註冊,拿 API key(免費 1000 次/月)
https://app.tavily.com/sign-in
# 2. 寫入 Hermes 環境變數
echo 'TAVILY_API_KEY=tvly-你的key' >> ~/.hermes/.env
# 3. 設定搜尋後端
hermes config set web.backend tavily
# 在終端輸入,duckduckgo 是 Hermes 內建的瀏覽器搜尋引擎
hermes config set web.backend duckduckgo

- 文件處理
格式轉化用 Pandoc:可將 PDF、DOCX、HTML、EPUB、LaTeX、CSV、reStructuredText、MediaWiki、OPML 轉成 Markdown、HTML、DOCX、PDF、EPUB、LaTeX、純文字...
PDF 轉 Markdown 效果差的話換 Marker
# 安裝 pandoc
幫我安裝 pandoc https://pandoc.org/installing.html#linux
#
幫我安裝 marker,連結為:https://github.com/datalab-to/marker
PDF 轉 Markdown 時使用 marker
推薦配置:
單頁抓取 → Jina Reader(r.jina.ai)
批次抓取 → Crawl4AI
反爬 → Scrapling(Hermes optional-skill)
搜尋 → Tavily(1000 次免費/月)+ DuckDuckGo 兜底
瀏覽器 → Camofox(需要時才用)
文件 → Pandoc + Marker
三. 表達能力
Agent 不只要能「看」,還要能「說」和「畫」
- 語音辨識
Telegram 場景的剛需。辨識用 Whisper 本地模式,99 種語言,Telegram 語音訊息自動轉文字
合成用 Edge TTS,微軟免費,品質不差,Hermes 預設方案。兩個加一起零成本
# 安裝 whisper
幫我安裝 whisper: https://github.com/openai/whisper
- 圖片生成
用 Fal.ai, Midjourney, DALL-E 3
# Black Forest Labs 官方 FLUX Skill
hermes skills install black-forest-labs/skills
# 匯入 FAL.ai 的 API-key
# 配置 FAL.ai, 去 fal.ai 註冊拿 key,有免費額度
echo 'FAL_KEY=你的key' >> ~/.hermes/.env

四. 效率與成本
- 如果你需要知道 token 花在哪裡?
token 監控用 tokscale。一條指令 tokscale --hermes 看全域消耗
深度分析用 hermes-dashboard,社群成員做的 token 面板,能按組件拆解:系統提示佔多少、工具定義佔多少、訊息歷史佔多少
# tokscale
# tokscale --hermes 看全域消耗
連結: https://github.com/junhoyeo/tokscale
# hermes-dashboard
連結: https://github.com/Bichev/hermes-dashboard
- 想減小 token 開銷的話
RTK(Rust Token Killer):能把終端指令的 token 消耗壓掉 80-90%
# RTK (Rust Token Killer)
https://github.com/adityahimaone/hermes-agent
- 自我進化
等系統穩定兩週後再開。hermes-agent-self-evolution 用遺傳演算法自動優化 Hermes 的 prompt 和行為,但建議搭配一個驗證 cron——防止優化循環把你還沒調好的配置「優化」得更亂。
- Skill 擴充
一次性裝 wondelai/skills(380+ 跨平台 skill)擴充基礎能力
再按需從 awesome-agent-skills(1000+ skills)裡挑
# skills 安裝
幫我安裝這個,連結為:https://github.com/wondelai/skills
五. 生態導航 — Hermes 資源彙總
收藏一個入口就夠了:awesome-hermes-agent 所有工具、skill、plugin、教學都在這裡
配套:
Hermes 生態地圖 → hermes-ecosystem.vercel.app(80+ 工具視覺化)
Hermes 官方文件 → hermes-agent.nousresearch.com/docs
🤩🤩awesome-hermes-agent → https://github.com/0xNyk/awesome-hermes-agent
Research王13-hermes 專欄: https://researchwang13.space/hermes
