# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Cos(余弦)😶‍🌫️ (@evilcos) · 平台：X (Twitter) · 日期：2026-03-25

> 原始來源：https://x.com/evilcos/status/2035176311216624102

## 中文摘要

SlowMist 發佈了「SlowMist Agent Security Skill」，這是一套為 AI Agent 在對抗性環境中運作所設計的全面安全審查框架。其核心原則為「每一個外部輸入都是不可信的，直到被驗證為止」。該框架涵蓋六大安全檢查面向：Skill/MCP 安裝前的惡意模式偵測、GitHub 程式庫程式碼安全審計、URL/文件掃描（針對 prompt injection 和社交工程）、區塊鏈地址的反洗錢風險評估與交易分析、產品/服務的架構與權限分析，以及聊天中推薦工具的驗證。

**風險評級與信任架構**

框架採用四層風險評級系統。🟢 低風險（純資訊性，無執行風險）由 Agent 通知使用者後可繼續；🟡 中等風險（功能受限、範圍明確）則需完整風險報告與謹慎建議；🔴 高風險（涉及證憑、資金或系統修改）需詳細報告且**必須人工批准**；⛔ 拒絕（命中紅旗模式或已確認惡意）則直接拒絕執行。信任等級分為五層，從官方專案/交易所（中度審查）到未知來源新帳號（最大審查力度），逐層提高檢查標準。

**危險模式與檢測範圍**

該框架內建三類攻擊模式資料庫：Code 層級的危險模式（11 類別）、社交工程模式（8 類別）、供應鏈攻擊模式（7 類別）。當 Agent 遇到 Skill/MCP 安裝請求、陌生 GitHub 程式庫、外部 URL、區塊鏈地址或產品推薦時，會自動參照此框架進行檢測與報告。

**安裝與整合方式**

使用者可透過直接下載並解壓至 OpenClaw 工作區安裝，或待 ClawHub 上線後透過指令安裝。框架提供模組化的文件結構，包含六份詳細審查指南、三份危險模式目錄與五份評估報告範本。同時支援可選的「MistTrack Skills」整合，以取得鏈上反洗錢風險數據。

**與現有方案的關係**

SlowMist 在推文中特別說明，該「Agent Security Skill」已在內部使用，在安全檢測方面更為強大。若使用者不需要「OpenClaw 極簡安全實踐指南」，可直接卸載；若只需保留紅線與黃線相關的保護機制，則可註明需求進行定制。這表明該框架是對既有 OpenClaw 安全方案的增強與補充，提供更結構化的檢測流程。框架並引用了之前發布的「OpenClaw Security Practice Guide」以及社群的 skill-vetter 實踐。

**設計理念**

框架強調「安全不是功能，而是前提」，將安全檢查整合為 Agent 的自動參照機制，而非事後手動審查。報告範本與模式庫設計便於擴展，社群可貢獻新攻擊模式、改進偵測規則與追加審查範本，採用 MIT 授權免費使用。

## 標籤

Skills, MCP, Agent, 資安, SlowMist