Hermes Agent 能為你做什麼(以及為什麼這很重要)
Hermes Agent 能為你做什麼(以及為什麼這很重要)
過去一年左右,你可能已經透過 ChatGPT 和 Claude Max 訂閱徹底升級了你的生活。
感覺很不錯,對吧?
研究速度變快了;你不再需要為工作撰寫那些繁瑣的電子郵件。需要製作一張低成本的圖表?搞定。甚至有些人已經在享受「vibecoding」(憑感覺寫程式)開發應用程式的樂趣了。
確實,到目前為止,人工智慧帶來的每一件事都很棒。它讓你變得更快,生活也更輕鬆。
但以目前的狀態,你真的能透過人工智慧徹底升級你的生活嗎?還是你只是在向一個非常強大的搜尋引擎發送 Prompt?
你在文字方塊中輸入一些文字和檔案,經過處理後得到答案。接著你關閉分頁,所有的 context 就消失了。
別誤會,這確實是很好的技術,但我們大多數人所認為的「人工智慧作為真正的力量倍增器」,並非現在這種樣子。
如果問題不在於人工智慧本身,而在於架構呢?如果我告訴你,有一個 AI Agent 存在,並且可以徹底重塑你的生產力堆疊(productivity stack),你會怎麼想?
讓我們來聊聊 Hermes Agent 吧,各位。

什麼是 Hermes Agent?
你們大多數人可能已經熟悉 Hermes 是什麼了,所以如果你已經知道了,請隨意跳過這一節。
對於新手,這裡有一個關於 Hermes Agent 的快速入門。
Hermes Agent 是由 @NousResearch 開發的 Agent 框架,該團隊也是 YaRN、Nomos 和 Psyche 的幕後推手。
目前的人工智慧狀態是靜態且無狀態的;而 Hermes Agent 的建立正是為了改變這種現狀。你進行對話、獲得結果、關閉分頁,然後就結束了。一切都被遺忘了。
Hermes 被設計為一個持久的、自託管的 AI Agent,它存在於你的電腦或伺服器上,能記住跨會話的所有內容,使用次數越多就越聰明,即使你不在電腦前,也可以透過 Telegram 或 Discord 從手機遠端存取。
它提供了一個封閉的學習迴圈,將每個完成的任務轉化為可重複使用的技能,並將過去的每一次對話轉化為可搜尋的長期記憶。
它可以在你選擇的任何模型上執行,在六種不同的後端執行程式碼和終端指令,並附帶一個不斷成長的技能庫,涵蓋從動畫影片製作到自主小說撰寫等各種功能。
你可以這樣想。
當大多數人提到人工智慧時,你的大腦會將其與 ChatGPT 這類聊天機器人產品劃上等號。
Hermes 更像是聘請了一位永遠不會睡覺、記得所有事情、工作越多表現越好,並且隨時隨地都能透過任何裝置聯繫到的員工。
Nous Research 團隊一直在持續更新以改進 Hermes。現在,隨著最新的更新,我們可能終於擁有了一個單一的 Agent 介面,它已經利用人工智慧徹底修復了生產力堆疊。

第一層:知識層 (The Knowledge Layer)
這個由 Hermes 驅動的新生產力堆疊的第一層,實際上並非始於 Nous Research 團隊;它始於 Andrej Karpathy。
作為人工智慧領域的知名人物,Andrej Karpathy 提出了「LLM-Wiki」的概念。
簡單來說,這個想法源於一個痛點:現今大多數 LLM 的運作方式類似於 RAG。這是一個時髦的說法,指代那些在搜尋、結構化、導航和交叉引用龐大知識庫方面效率不足的系統。
例如,你將一些檔案丟給 ChatGPT 並跟進一個 Prompt,它在查詢時會檢索相關片段並給你答案。但如果你問它一個需要綜合多份文件才能回答的問題,它就必須重新發現相關片段。
這裡沒有知識的積累,只有重新發現。
因此,有人提出了 LLM-Wiki。這是一個運作方式更像動態百科全書的系統,其中所有的知識都是結構化的、相互連結的、持久的,並且隨著每一次新的互動、資料或檔案的添加而不斷積累。
這使得 LLM 變得更加複雜,具有更好的記憶力,並且能更輕鬆地導航和交叉引用所有可用資料。

你可以這樣想。
想像你的大腦是一個圖書館。
每次你學習新東西——你讀的一篇文章、你進行的一次對話、你在凌晨兩點鑽研的一個冷門知識——圖書館員就會走進來並把它歸檔到某個地方。
多年過去了,那位圖書館員變得非常擅長知道每樣東西在哪裡、不同想法之間如何連結,以及當你需要時什麼是相關的。你的知識會不斷疊加。
LLM-Wiki 就像是為 LLM 準備的「類固醇版」圖書館員。
Nous Research 已經認識到 LLM-Wiki 概念的力量,並最近將其作為一項「技能」實作在 Hermes Agent 終端中。
這項技能最終構成了你生產力堆疊的基礎層。
所有原始筆記、互動、檔案和其他資訊將始終可用,無需隨時更新 context。
Agent 將永久了解你的領域,並且根據你為其設計的任務,以 LLM-Wiki 作為基礎知識層,它只會變得越來越強大。
第二層:執行層 (The Execution Layer)
現在我們來到 Nous Research 團隊最近進行的另一個升級:v0.6.0 版本。
這是多 Agent 設定檔(multi-agent profile)的引入。
這次更新的核心在於,透過一次安裝,你就可以擁有多個 Agent。這些子 Agent 是獨立的工作者,可以由主 Agent 啟動,並且每個子 Agent 都可以被分配特定的任務。
與此同時,還引入了設定檔(profiles)。設定檔使得每個子 Agent 都能擁有自己獨立的配置、記憶、會話、技能和閘道服務。因此,無論子 Agent 被設計用於什麼任務,它都會持久地只執行該任務。
那麼,讓我們透過將多 Agent 加入框架來擴展這個生產力堆疊。
想像一個假設的情境:你正在經營一家行銷代理商(你們大多數人註定要留在基層,但唉,人總是要有夢想)。
一家行銷代理商有很多運作環節。客戶關係、內容撰寫、編輯、組織/規劃、研究等等。
有了這個新的多 Agent 更新,你的主 Hermes Agent 能夠啟動一個專注於研究的研究 Agent、一個了解你發布慣例的寫作 Agent、一個知道如何安排行程的組織 Agent,以及一個可以處理所有討厭的客戶電子郵件的電子郵件助理。
一次安裝,多個 Agent。
同時,這些 Agent 有能力利用底層的 LLM-Wiki(知識層)。
所以,假設一個新的研究 Agent 被啟動,用來深入研究新領域的客戶。
它將已經具備引用相關 Wiki 頁面的能力,而不是盲目開始。
這意味著從一開始,所有 Agent 都具備 context;它們了解你的偏好、領域、結構以及任何其他相關資訊。
瞧,就這樣,你提升了你的生產力堆疊。
但透過 Hermes 的實際輸出是什麼樣子呢?
第三層:輸出層 (The Output Layer)
嗯,與大多數只會空談的產品不同,Hermes 已經有大量的實例證明它言出必行。
讓我們從第一個開始,老實說,我認為這是輸出層中更令人印象深刻的元素。
Hermes 最近推出了「Manim」技能。
Manim 技能是一個用於為數學和技術解釋創建簡潔、美觀且坦白說是一流動畫/視覺效果的引擎。
這項技能的動畫靈感來自 3Blue1Brown 頻道,我相信你們大多數人都很熟悉。
所以讓我們回到我們的行銷代理商例子。
你透過 Hermes 經營代理商,並且你正在與一個擁有極其複雜 DeFi 產品的客戶合作。沒人真正理解,而且絕對沒有人會去閱讀文件。
對我們這些大腦退化、零注意力的大腦來說,能產生共鳴的是好的、乾淨的視覺效果。
好吧,內容創作子 Agent 可以透過利用 Manim 快速製作一個動畫,就這樣,你有了一個擁有許多新使用者的快樂客戶。
Hermes 實際運作的另一個例子可以從它確實成功寫出了一整部小說的事實中看出。一部 19 章、79,456 字的小說。完全由 Hermes 撰寫,並由 Claude 進行同行評審。
所以,是的,Hermes 的輸出層不留任何懷疑空間。它正在運作,而且效果非常好。現在,剩下的就看你如何選擇在新的生產力堆疊中利用它了。
Hermes 正迅速成為市面上最好的 AI Agent 之一,它讓你能夠真正地升級你的生活,而不僅僅是透過一些從網際網路上聚合答案的基本 Prompt。
如果你還沒有熟悉這個平台,現在正是開始行動並建立你的生產力堆疊以升級生活,並讓自己脫穎而出的最佳時機。
✍️ @LeftsideEmiri
