# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：AlphaSignal AI (@AlphaSignalAI) · 平台：X (Twitter) · 日期：2026-05-14

> 原始來源：https://x.com/AlphaSignalAI/status/2054617475484938719

## 中文摘要

# 研究人員剛統計出 146,932 筆虛構引用。這個儲存庫是第一個可安裝的修復方案

## 學術研究技能：4 個 Claude Code 技能、25 種模式、兩道完整性閘門、CC BY-NC 4.0 授權

---

> 閱讀約 10 分鐘後，你將決定是否安裝並使用它，以及如何立即上手每一項技能。

> 想看重點？請查看這個 HTML 互動指南（測試版），靈感來自 @trq212。

Zhao 等人剛在 2025 年的預印本記錄中統計出 146,932 筆虛構引用（arXiv:2605.07723, 2026-05）。

「學術研究技能」（Academic Research Skills）是第一個可安裝的 Claude Code 工作流程，它將修復機制直接整合進論文撰寫流程中。

Cheng-I Wu 於 2026 年 5 月 5 日發布了 v3.7.0 版本，僅需兩條指令即可完成 plugin 安裝。

授權方式為 CC BY-NC 4.0：屬於原始碼公開（source-available），而非 OSI 定義的開源軟體。

---

## 背景

該儲存庫由 Cheng-I Wu（GitHub 帳號 Imbad0202）開發。它建立於 2026 年 2 月 26 日，目前已累積超過 6.7k 個星星。

README 中提到了其知識淵博的血統。方法論借鑒自 PaperOrchestra（Song, Song, Pfister, Yoon, 2026, Google, arXiv:2604.05018）。失敗模式分類則來自 Lu 等人（2026, Nature 651:914-919, "The AI Scientist"）。

它解決的問題非常具體。大多數 AI 學術工作流程都以私人對話中的一次性 Prompt 形式存在。從文獻搜尋、草稿、同儕審查、引用檢查到揭露聲明的整個流程，每次都需要重新建構。「學術研究技能」將該流程封裝為四個 Claude Code 技能，並在每個階段強制要求人工檢查點。

---

## 儲存庫快照

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778725062063-iaHIN0mUkXAAAUGJQjpg.jpg)

---

## 技術架構

> 你可以直接跳到下方的「如何開始」章節。

該套件包含四個技能、宣告的資料存取層級、25 種註冊模式以及一個 10 階段的編排流程。每個技能負責工作流程的一部分。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778725062052-iaHIN0qgQWUAA3kmIjpg.jpg)

`deep-research` 包含 13 個 Agent 和 7 種模式。它負責上游調查：文獻回顧、事實查核、系統性回顧、蘇格拉底式問題框架。資料存取層級為原始資料（raw）。模式包括 full、quick、socratic、lit-review、fact-check、systematic-review 和 review。

`academic-paper` 包含 12 個 Agent 和 10 種模式。它處理撰寫、修訂、引用檢查、格式轉換和 AI 揭露聲明。資料存取為去識別化（redacted）。模式包括 full、plan、outline-only、revision、revision-coach、abstract-only、lit-review、format-convert、citation-check 和 disclosure。

`academic-paper-reviewer` 包含 7 個 Agent 和 6 種模式。它執行多視角的同儕審查，包含一位總編輯、三位動態審查員和一位魔鬼代言人。資料存取為僅驗證（verified_only）。校準模式會根據使用者提供的黃金集（gold set）來測量審查員自身的 FNR/FPR。

`academic-pipeline` 包含 4 個 Agent，負責編排上述所有流程。它執行 10 階段流程：研究、撰寫、階段 2.5 完整性檢查、同儕審查、修訂、重新審查（最多 2 輪）、階段 4.5 最終完整性檢查、格式轉換、最終輸出和流程總結。

階段 2.5 和階段 4.5 的完整性閘門是核心支撐。它們執行基於 Lu 等人列舉的 7 種失敗模式檢查清單：實作錯誤、虛構結果、依賴捷徑、將錯誤視為洞察的重構、方法論捏造、框架鎖定以及引用虛構。這些閘門會在偵測到疑似失敗時阻斷流程，而非僅僅靜默標記。

「Material Passport」是交接架構。它在技能之間傳遞 `literature_corpus[]`，包含 CSL-JSON 格式的作者、年份、標題，以及指向使用者自身知識庫的來源指標。自 v3.6.5 起，使用者執行的是「語料庫優先，搜尋補足缺口」的流程：先篩選使用者的語料庫，僅針對剩餘缺口搜尋外部資料庫。

v3.7.3（目前在 main 分支開發中，尚未發布）是針對 Zhao 等人審計報告的直接回應。該審計涵蓋了 arXiv、bioRxiv、SSRN 和 PMC 中 250 萬篇論文的 1.1 億條參考文獻，僅 2025 年就發現了 146,932 筆虛構引用，並報告稱 85.3% 的預印本虛構內容會延續到正式出版記錄中。v3.7.3 補足了該論文所指出的「主張真實性」缺口中，關於定位管道的那一半。

具體新增功能是「三層引用發布」（Three-Layer Citation Emission）。每個可見的引用在 `<!--ref:slug-->` 標籤後都會有一個隱藏的 `<!--anchor:<kind>:<value>-->` 標記，其中 `<kind>` 為引文、頁碼、章節、段落或無。引文錨點限制在 25 個字以內。若發布為「無」，則會觸發最終確認階段的硬性拒絕。L3 級別的完整主張真實性審計將在 v3.8 推出。

污染訊號是 v3.7.3 的第二項新增功能。當引用年份 >= 2024 且來源位於十個預印本伺服器（arXiv, bioRxiv, medRxiv, SSRN, Research Square, Preprints.org, ChemRxiv, EarthArXiv, OSF Preprints, TechRxiv）的封閉清單中時，會觸發 `preprint_post_llm_inflection`。當現有的 Semantic Scholar API 協定回傳無匹配結果時，會觸發 `semantic_scholar_unmatched`。兩者皆為建議性註釋，而非阻斷性閘門。

---

## 如何開始

Plugin 安裝（Claude Code CLI、VS Code、JetBrains，v3.7.0+）僅需兩條指令：

```bash
/plugin marketplace add Imbad0202/academic-research-skills
/plugin install academic-research-skills
```

這將設定四個技能、三個 plugin Agent、十個 `/ars-*` 斜線指令以及一個 SessionStart 公告 Hook。輸入 `/ars-plan` 並描述一篇論文來進行驗證。該技能應會開啟蘇格拉底式對話來規劃章節結構。

傳統安裝路徑（git clone + 符號連結）仍適用於舊版 Claude Code 使用者，或任何想要針對專案控制技能的使用者：

```bash
git clone https://github.com/Imbad0202/academic-research-skills.git ~/academic-research-skills
cd /path/to/your/project
mkdir -p .claude/skills
ln -s ~/academic-research-skills/deep-research .claude/skills/deep-research
ln -s ~/academic-research-skills/academic-paper .claude/skills/academic-paper
ln -s ~/academic-research-skills/academic-paper-reviewer .claude/skills/academic-paper-reviewer
ln -s ~/academic-research-skills/academic-pipeline .claude/skills/academic-pipeline
```

最低執行環境為 Claude Code 加上一個 Anthropic API key：

```bash
export ANTHROPIC_API_KEY=sk-ant-...
claude
```

用於 DOCX 和 APA 7.0 PDF 輸出的選用文件工具：

```bash
brew install pandoc
brew install tectonic
```

對於 Codex CLI 使用者，有對應的發行版本 Imbad0202/academic-research-skills-codex。內容與工作流程相同，但採用 Codex 原生封裝。

根據 `docs/PERFORMANCE.md`，使用 Opus 4.7 處理一篇 15,000 字、60 條參考文獻的論文，成本約為 4 到 6 美元。跨模型驗證（ARS_CROSS_MODEL）會增加 0.60 到 1.10 美元。完整執行會超過 200K 輸入和 100K 輸出 token，因此長時間的對話可能會失去 Prompt Cache 的優勢，需要使用 Material Passport 進行恢復。

---

## 如何實際使用

三個進入點涵蓋了大多數實際用途。

完整流程。輸入 `/ars-full` 或以自然語言描述目標（例如：「我想寫一篇關於 AI 對高等教育品質保證影響的研究論文」）。編排器從階段 1 開始，走完所有十個階段，並在每個 FULL 檢查點要求使用者確認。輸出為一份完成的 APA 7.0 論文、編輯決定信、修訂路線圖、兩份完整性報告以及一份 AI 自我反思報告。

引導式規劃。當研究問題尚未明確時，輸入 `/ars-plan`。蘇格拉底導師 Agent 會將使用者意圖分類為探索性或目標導向。探索模式會停用自動收斂，並進行逐章對話：定義問題、選擇方法、規劃論點。輸出為章節計畫以及 INSIGHT 集合。

針對性的單一技能呼叫。當只需要一個功能時，可跳過編排器：

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778725062071-iaHIN1fmTWAAAOyZ9png.png)

典型的第一次對話如下：執行 `/ars-plan` 取得章節地圖。接著執行 `/ars-lit-review` 來填充語料庫。最後執行 `/ars-full`，此時 Material Passport 中已填入語料庫。

Material Passport 是對話間的交接工具。它攜帶文獻語料庫、章節計畫和完整性報告。若要在新的 Claude Code 對話中恢復之前的執行，請設定 `ARS_PASSPORT_RESET=1` 並使用 `resume_from_passport=<hash>` 模式。

對於現有的草稿，輸入「I already have a paper, review it」即可從階段 2.5 進入流程，並優先執行完整性檢查。若要回應審查員意見，輸入「I received reviewer comments」即可從階段 4 進入修訂教練流程。

流程結束於「流程總結」階段：針對六個維度進行協作品質評估，評分 1 到 100。該分數會匯入 AI 自我反思報告，呈現該次執行的讓步率、健康警示和諂媚風險。

---

## 證據

「學術研究技能」是目前學術 Claude Code 技能群中，唯一將多階段完整性閘門直接整合進流程本身的候選方案。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778725062060-iaHIN1mDjW0AASrZnjpg.jpg)

比較是基於架構而非經驗數據。目前尚無針對學術流程工具的正式基準測試。

---

## 當前限制（5 月 13 日）

授權摩擦。CC BY-NC 4.0 禁止商業用途。屬於原始碼公開，而非 OSI 開源。

Claude Code 綁定。參考發行版以 Claude Code 為主。存在 Codex 的兄弟版本。Cursor、OpenCode 和 Gemini 尚未納入支援。

完整性閘門洩漏。維護者在展示論文的出版後審計中，發現 68 條參考文獻中有 21 個問題通過了三輪自動完整性檢查。v3.7.3 補足了定位管道的一半。完整的「主張真實性」審計推遲至 v3.8。

標籤版本與 main 分支的差異。v3.7.0 是最新的標籤版本。三層引用發布功能目前位於 main 分支作為 [未發布] 的 v3.7.3 工作。

元資料不一致。`.claude-plugin/plugin.json` 聲稱有「35+ 種模式，32 個 Agent 集合」。`MODE_REGISTRY.md` 則說有 25 種模式。直接計算檔案數量則發現有 36 個 Agent。

---

## AlphaSignal 觀點

值得關注。

「學術研究技能」確實交付了其 README 所宣稱的功能。v3.7.0 是簽名發布版本，plugin asset 已就位（`.claude-plugin/`、10 個 `/ars-*` 指令、3 個 plugin Agent、SessionStart Hook），且靜態檢查通過了規格一致性、架構和模式保護檢查。該工作流程架構是目前針對引用虛構問題（該問題剛被量化為語料庫規模）最強大的可安裝回應。

一個非顯而易見的發現是，維護者記錄了他自己的失敗。在展示審計中，68 條參考文獻中有 21 條漏過了三輪完整性檢查。這種誠實是證明閘門確實發揮作用的最強證據。這也是為什麼結論並非「生產就緒」（Production Ready）的原因。

能改變結論的因素包括：寬鬆的授權（或商業層級）、v3.8 中發布的 L3 完整主張真實性審計，以及非 Claude Code 的參考發行版。在此之前，工作流程的設計價值大於其執行價值。

---

## 誰受益，誰不受益

博士生、學術研究人員、在非商業環境下使用 Claude Code 的實驗室團隊、研究完整性閘門如何整合進多階段工作流程的 Agent 工具開發者，以及評估 AI 揭露架構的期刊或研討會。

商業 SaaS 或付費諮詢團隊（CC BY-NC 4.0 禁止此類建構）、僅使用 Cursor 或 OpenCode 的技術堆疊（參考發行版以 Claude Code 為主），以及任何需要位元級可重現引用保證的人（v3.7.3 的錨點在某些地方僅具建議性質，L3 完整審計尚未發布）。

## 從業人員啟示

使用 Claude Code 的研究人員現在可以安裝一個包含強制完整性閘門的 10 階段學術工作流程，且 v3.7.0 提供了單行指令的 plugin 安裝路徑。

---

## 連結

- github.com/Imbad0202/academic-research-skills (儲存庫，約 5 分鐘 plugin 安裝)

- arxiv.org/abs/2605.07723 (Zhao 等人引用虛構審計，約 25 分鐘閱讀)

追蹤 @AlphaSignalAI 獲取更多此類內容。

---

訂閱 AlphaSignal.ai 獲取每日 AI 訊號。超過 280,000 名開發者閱讀。

## 常見問題

Q：如何在 Claude Code 中安裝「學術研究技能」？

A：兩條 plugin 指令：`/plugin marketplace add Imbad0202/academic-research-skills` 然後 `/plugin install academic-research-skills`。需要最新版 Claude Code 和 ANTHROPIC_API_KEY。首次執行：`/ars-plan`。

Q：「學術研究技能」會自動撰寫論文嗎？

A：不會。該儲存庫的 `POSITIONING.md` 明確指出 ARS 是輔助性質，而非自主性質。在每個 FULL 階段以及階段 2.5 和階段 4.5 的完整性閘門處，強制要求人工檢查點，以防止流程靜默推進。

Q：ARS 如何減少引用虛構？

A：兩道完整性閘門（階段 2.5 預審查、階段 4.5 預定稿）執行 7 種模式的失敗檢查清單，外加 Semantic Scholar API 驗證。v3.7.3 新增了「三層引用發布」：每個引用後方隱藏的錨點標記會指定引文、頁碼、章節或段落定位。

Q：執行完整的論文工作流程需要多少成本？

A：根據 `docs/PERFORMANCE.md`，使用 Opus 4.7 處理一篇 15,000 字、60 條參考文獻的論文，成本約為 4 到 6 美元。跨模型驗證會增加 0.60 到 1.10 美元。完整執行會超過 200K 輸入和 100K 輸出 token。

Q：「學術研究技能」是開源的嗎？

A：屬於原始碼公開，而非 OSI 開源。授權為 CC BY-NC 4.0（創用 CC 姓名標示-非商業性 4.0）。商業 SaaS、託管服務、付費諮詢和企業部署需要額外授權。

## 標籤

Skills, Claude Code, 研究論文, 開源專案, 教學資源, Anthropic, Claude