
2個月的實踐:本地運行AI Agent的完整系統
作者在Mac Mini上運行的自動化Agent系統,每月成本僅$21,展示了個人如何在完全離線的環境中建構持久的人工智慧基礎設施。這套系統透過結構化的context層、自動化cron工作流和聲音回饋迴圈,將碎片化的研究轉化為複合增長——證明高效的AI應用不需要雲端基礎設施或昂貴的GPU叢集。
硬體與架構基礎
核心設備為一台2026年購入的Mac Mini M4(16GB記憶體),24/7運行,佔用空間僅約120MB的Agent框架和6.6GB的本地LLM模型。完全不依賴雲端或按月付費的AWS服務——整個系統被裝在客廳裡的一台$600的電腦上。
Agent框架:Hermes
Hermes是Nous Research開發的開源Python框架,透過Telegram bot作為互動介面。Agent可以存取終端、讀寫檔案、搜尋網頁、抓取完整文章、執行程式碼、運行shell script,並使用自訂技能。作為macOS launchd服務運行,開機自啟且當機時自動重啟。
框架優勢與限制:
- 優勢:完整的工具存取、cron排程器、技能系統、持久記憶體、工作階段管理、MCP支援
- 限制:僅支持單層備用模型、缺乏自動工作階段清理、生成內容品質受限於模型本身
三層模型堆疊
互動聊天(GLM-5 via Z.AI):推理能力強但寫作品質差。模型持續生成內部推理token,即使不需要這些thinking也會產生,導致conversation history膨脹——15-20次對話後,Agent需重新處理數千個舊推理token,速度劇減。
自動化工作(GLM-4.7 via Z.AI):所有18個cron任務使用此模型,因為Z.AI編碼方案有速率限制(5小時600個prompt)。若cron使用GLM-5會耗盡互動配額。
壓縮層(Qwen3.5 via本地Ollama):最重要的改進。原本使用雲端API壓縮導致「死亡螺旋」:cron運行→context增長→壓縮觸發→消耗API配額→rate limit→壓縮失敗→context無限增長→Agent掛起10分鐘。改用本地Ollama完全免費、無速率限制。另設定工作階段閒置逾時為60分鐘(預設24小時),使session在各任務間重置,響應時間從10+分鐘降至5秒以內。
18個自動研究工作流
每日:早晨簡報(7:00)涵蓋隔夜資訊、arXiv AI agent論文、Hacker News、Reddit、專案優先級;競爭對手儀表板(7:30)追蹤11+個CDP和穩定幣協議的TVL變化;Dune監控(9:00、17:00);內容起草(10:00);優先級引擎(11:00);草稿審核(12:00);AI新聞研究(14:00);DeFi研究(18:00);深度研究(20:00);健康檢查(21:00);內容績效日誌(22:00);夜間自動構建(23:00)——Agent自主編寫程式碼以填補缺口,如監控腳本、修復破損解析器、建立新資料管道。
週期性工作:出站CRM(週一/四)、週度情報、學習摘要(週日/三)、周計劃(週日)。
每小時突發新聞監控(上午9點-下午8點)。
以「research-ai」為例,3,000字的prompt執行13步流程:強制URL驗證(防止幻覺)→讀取7個context檔案→檢查郵件→arXiv掃描→檢查新工具→多源搜尋(強制順序:Techmeme→Hacker News→Reddit→網路搜尋)→深度閱讀頂級文章→寫入發現→草擬內容→品質檢查(≥70/100)→操作日誌→更新專案context→自檢驗。
35個Shell Script與自動化層
資料來源:coingecko.sh(無API金鑰)、defillama.sh、RWA追蹤器、Hacker News、Reddit摘要、治理追蹤器、arXiv搜索、聯準會經濟資料。
監控:TVL變動警報(>10%)、穩定幣供應量變化(>$1億)、突發新聞、健康檢查。
內容管道:draft品質評分、草稿審核、發佈歸檔、績效日誌。
基礎設施:walnut更新(77行bash,在所有研究cron末尾呼叫,是cron與context系統的膠合劑)、記憶體壓縮、GitHub推送前的13層密鑰洩露掃描、自動更新、Docker清理。
大多數腳本少於50行,價值在於35個工具協同運作。
6個自訂技能
- walnuts:輸入一個詞→Agent讀取5個專案context檔案→合成跨專案視圖(優先級、阻礙、緊張關係)
- grimoire:Telegram頻道草稿(視覺優先,1-4句+圖片,包含URL驗證)
- yari-intel:市場分析(CDP TVL、競爭對手、RWA機會、治理)
- arcana-intel:諮詢市場研究(已編輯)
- alpha-scanner:跨源信號檢測(Polymarket、穩定幣流動、RWA動力、社交信號)
- voice-learn:草稿回饋迴圈,提取編輯並存為lessons
Skill是markdown檔案,執行時Agent讀取並遵循——新增能力只需10分鐘。
ALIVE:複合Context系統
由@stackwalnuts創建,將知識組織成「walnut」——每個專案/領域的context容器。結構包含~/world/下的5個walnut(個人品牌、3個風險投資、1個實驗),每個walnut有5個核心檔案:身份(key.md)、當前狀態(now.md)、任務(tasks.md)、洞察(insights.md)、日誌(log.md,只追加)。
三層整合:
- Cron任務寫入 walnut:研究結束時update-walnut.sh前置日誌項目到相關walnut
— witcheer ☯︎ (@witcheer) March 27, 2026