核心產品與功能
SlowMist 發佈了「SlowMist Agent Security Skill」,這是一套為 AI Agent 在對抗性環境中運作所設計的全面安全審查框架。其核心原則為「每一個外部輸入都是不可信的,直到被驗證為止」。該框架涵蓋六大安全檢查面向:Skill/MCP 安裝前的惡意模式偵測、GitHub 程式庫程式碼安全審計、URL/文件掃描(針對 prompt injection 和社交工程)、區塊鏈地址的反洗錢風險評估與交易分析、產品/服務的架構與權限分析,以及聊天中推薦工具的驗證。
風險評級與信任架構
框架採用四層風險評級系統。🟢 低風險(純資訊性,無執行風險)由 Agent 通知使用者後可繼續;🟡 中等風險(功能受限、範圍明確)則需完整風險報告與謹慎建議;🔴 高風險(涉及證憑、資金或系統修改)需詳細報告且必須人工批准;⛔ 拒絕(命中紅旗模式或已確認惡意)則直接拒絕執行。信任等級分為五層,從官方專案/交易所(中度審查)到未知來源新帳號(最大審查力度),逐層提高檢查標準。
危險模式與檢測範圍
該框架內建三類攻擊模式資料庫:Code 層級的危險模式(11 類別)、社交工程模式(8 類別)、供應鏈攻擊模式(7 類別)。當 Agent 遇到 Skill/MCP 安裝請求、陌生 GitHub 程式庫、外部 URL、區塊鏈地址或產品推薦時,會自動參照此框架進行檢測與報告。
安裝與整合方式
使用者可透過直接下載並解壓至 OpenClaw 工作區安裝,或待 ClawHub 上線後透過指令安裝。框架提供模組化的文件結構,包含六份詳細審查指南、三份危險模式目錄與五份評估報告範本。同時支援可選的「MistTrack Skills」整合,以取得鏈上反洗錢風險數據。
與現有方案的關係
SlowMist 在推文中特別說明,該「Agent Security Skill」已在內部使用,在安全檢測方面更為強大。若使用者不需要「OpenClaw 極簡安全實踐指南」,可直接卸載;若只需保留紅線與黃線相關的保護機制,則可註明需求進行定制。這表明該框架是對既有 OpenClaw 安全方案的增強與補充,提供更結構化的檢測流程。框架並引用了之前發布的「OpenClaw Security Practice Guide」以及社群的 skill-vetter 實踐。
設計理念
框架強調「安全不是功能,而是前提」,將安全檢查整合為 Agent 的自動參照機制,而非事後手動審查。報告範本與模式庫設計便於擴展,社群可貢獻新攻擊模式、改進偵測規則與追加審查範本,採用 MIT 授權免費使用。
如果不需要“OpenClaw 极简安全实践指南”,直接给你的 OpenClaw 说卸载就行,如果你希望只留红线黄线有关的保护机制,注明好这个要求就行。
— Cos(余弦)😶🌫️ (@evilcos) March 21, 2026
顺便说下 SlowMist Agent Security Skill 内部已经在使用,在安全检测方面会更强大。这个和我们之前发布的“OpenClaw… pic.twitter.com/jkKspBkhTd
SlowMist Agent Security Skill 已发布:https://t.co/yInir1C8Ujhttps://t.co/Zx1fiPvIu6
— Cos(余弦)😶🌫️ (@evilcos) March 24, 2026
