# Anthropic分析惡意帳號揭示AI自主威脅

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 原作者：Anthropic (@AnthropicAI) · 策展與摘要：EasyVibeCoding · 平台：X (Twitter) · 熱度：🔥 · 日期：2026-06-04

> 原始來源：https://x.com/AnthropicAI/status/2062243425580367905

## 證據與延伸閱讀

- [Anthropic分析832個惡意帳號](https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack)

## 中文摘要

Anthropic分析惡意帳號揭示AI自主威脅。

Anthropic 在這份針對 2025 年 3 月至 2026 年 3 月間被封鎖的 832 個惡意帳號分析報告中指出，AI 正在改變網路攻擊的本質，使得傳統的風險評估指標逐漸失效。該研究詳細內容可參考 [Anthropic 官方報告](https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack) 與 [Frontier Red Team 部落格](https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack)。

**AI 提升攻擊威脅等級**
研究發現，惡意攻擊者正將 AI 應用於攻擊生命週期中更複雜的後期階段，而非僅限於初期入侵。
- 惡意軟體撰寫仍是 AI 最常見的用途（佔 67.3%，共 560 個帳號）。
- 攻擊者開始將 AI 用於「橫向移動」（lateral movement），即在受感染的網路中進行深度導航，這類高階操作佔比為 6.5%。
- 風險評估數據顯示，攻擊者的威脅等級顯著提升：在分析期間的前六個月，中高風險攻擊者佔比為 33%，後六個月則攀升至 56%，成長約 1.7 倍。
- 攻擊手法出現轉移：AI 輔助的網路釣魚（Phishing）下降了 8.6%，但用於「帳號探索」（Account discovery）的比例上升了 8.9%，顯示攻擊者正將 AI 深入應用於系統內部的滲透作業。

**傳統風險評估指標失效**
Anthropic 指出，由於 AI 能代勞高度技術性的任務，傳統用來區分攻擊者技術水準的指標已不再準確。
- 技術水準與攻擊手法數量之間已無顯著關聯：資料集中技術最差的攻擊者平均使用約 16 種技術，而最頂尖的攻擊者僅使用約 20 種。
- 使用的介面（如 `Claude Code`、API 或聊天介面）也無法作為判斷風險高低的依據。
- 目前唯一的關鍵區別在於「架構設計」：高風險攻擊者會設計特定的架構，讓模型能將攻擊的各個離散階段串聯起來，並在極少的人為介入下自動執行。

**MITRE ATT&CK 框架的侷限**
現行的 MITRE ATT&CK 框架尚未完整涵蓋 AI 賦能攻擊者的核心能力，特別是「Agentic 程式開發」帶來的自動化威脅。
- 2025 年 11 月發生的一起國家級網路間諜行動中，攻擊者操縱 `Claude Code` 進行全球滲透，幾乎無需人為干預。
- 若僅以 MITRE ATT&CK 框架評估，該攻擊僅涉及 13 種戰術下的 30 種技術，與中等風險攻擊者無異；但若採用 Anthropic 的風險評估方法，該攻擊則被評為最高風險等級（100 分）。
- 該框架目前缺乏針對「Agentic 編排」的識別碼（ATT&CK ID），無法有效描述模型自主執行指令、利用漏洞、竊取憑證及進行戰術決策的行為。

**未來防禦策略**
Anthropic 強調，隨著 AI Agent 能力增強，防禦方必須採取更主動的策略。
- Anthropic 已在最強大的模型中部署網路安全防護機制，以偵測並封鎖開發惡意軟體或大規模資料外洩等行為。
- 該公司正與 MITRE 進行討論，推動 ATT&CK 框架演進，將 AI 賦能的攻擊行為納入評估體系。
- Anthropic 承諾將持續透過「Project Glasswing」等專案分享研究成果，並提供互動式視覺化工具，協助防禦者掌握最新的威脅動態。

## 標籤

研究論文, 資安, 產業趨勢, Anthropic