# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Kyrie (@KyrieCheungYep) · 平台：X (Twitter) · 日期：2026-06-16

> 原始來源：https://x.com/KyrieCheungYep/status/2066703125659156572

## 中文摘要

# 每天省下 3 小時，用 Codex 搭建自動化資訊收集流水線

我每天早上打開電腦，做的第一件事：

查客戶：這家公司最近有什麼動作、融資、招聘、負面；看政策：跟我業務相關的監管、補貼、行業文件有沒有更新；掃美股：我關注的領域，昨晚發生了什麼，有沒有要緊的新聞和資料。

這三件事有個共同點：重複、零碎、每天都要做。單獨看每一條，又都不值得你花半小時。我一開始是開十幾個分頁，搜一圈，複製貼上到 Obsidian，再手動整理。一套下來一兩個小時就沒了，第二天還得再來。

![這張圖表展示了從多種資訊來源進行手動篩選，並將內容複製貼上至 Markdown 檔案的資訊整理流程。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/eaae741afbcd867e.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">該圖表以科技感藍色調呈現資訊處理流程，分為三個階段：
1. 「資訊源」：包含「客戶」、「網頁」、「政策」、「RSS」、「美股」、「社媒」六個圖示。
2. 「手動篩選」：透過一個漏斗圖示，將上述來源的資訊進行篩選與整理。
3. 「待整理」：右側顯示一個名為「每日信息.md」的檔案介面，內容包含：
   - # 每日信息
   - ## 客戶動態
   - ## 政策更新
   - ## 美股速遞
   - 圓形進度條顯示「30% 未完成」。
中間箭頭標示為「複製粘貼」。</div></details>

我把這套活交給了 Codex。早上喝咖啡的時候，它已經把昨晚的客戶動態、政策更新、美股要聞整理成 Markdown，放進我的 vault，每條都帶原文連結。

我會把我用的這套方法完整拆解給大家。少講概念，多給流程，看完就能自己搭一版。

## 一、為什麼用 Codex？

很多人覺得：資訊收集，我直接問 ChatGPT 不就行了？

差別挺大。聊天框裡的 AI 是你問一句、它答一句，結果留在對話裡，你還得手動搬運。Codex 多了一層關鍵能力：它能在你電腦上幹活。它能讀檔案、改檔案、跑指令、聯網搜、透過 MCP 協定連外部工具，最後把結果直接寫進你指定的目錄。

這裡有個經常被低估的事實：你的終端本來就能看到你電腦上的一切。Obsidian 筆記就是一堆 Markdown 檔案，你 cd 進 vault，Codex 就能直接讀寫它們。沒有 plugin，沒有 API key，也不用複製貼上。一個長期住在 Cursor 裡的開發者就是因為這一點轉向了 Codex CLI：每次想讓 AI 幫他理筆記，要麼把整個 vault 拖進編輯器，要麼來回複製上下文，煩得要死。後來他發現，那些摩擦其實是自己加出來的。

在找資訊這件事上，Codex 強到什麼程度？一位 OpenAI 內部研究員，一個月能燒掉一萬美金 API 費用的重度使用者，這麼形容它：

> "Codex 就是一個極其出色的搜尋引擎。"

他讓 Codex 做調研時，它會自己翻相關 Slack 頻道、讀討論、拉出別人提到的實驗分支、看截圖、翻文件和表格，最後彙總成一份帶連結的筆記。每條資訊都會標註來源。他用這套方法在幾個小時內生成了 700 多條可驗證的假設。他大致的判斷是：在容易犯錯、代價又高的場景裡，你需要一個很勤快、召回率很高的搜尋 Agent。

這正好對應資訊收集最麻煩的三件事：儘量搜全、能追到來源、最後能變成可用檔案。Codex 在這三件事上都好用。

## 二、五句心法：把 Codex 從工具變成隊友

動手前，先把 OpenAI 官方最佳實踐裡最有用的部分記住。核心很簡單：不要把 Codex 當一次性助手，要把它配置成一個長期跟著你工作的隊友。

具體有五點：

1. 先給足上下文，別讓 Codex 猜你的意思；
2. 用 AGENTS.md 做長期指導，把它調成貼合你工作流的樣子；
3. 用 MCP 連接外部系統，少做複製貼上；
4. 把重複工作抽成 Skill，別反覆輸入同一段 Prompt；
5. 把穩定流程做成自動化，把固定動作交出去。

還有一個區分要記住：

> Skill 定義怎麼做，Automation 定義什麼時候做。

對應到資訊收集，就是一條升級路徑：先教會它怎麼搜，給它聯網的眼睛，再把搜法固化成 Skill，最後讓它定時自己跑。下面一段段來。

## 三、搭地基：把 Codex 調成你的資訊收集助手

### 3.1 給它寫一份崗位說明書：AGENTS.md

AGENTS.md 是 Codex 的入職手冊，每次啟動會自動載入。它會影響 Codex 怎麼理解你的需求。做資訊收集時，我在 vault 根目錄放了這麼一份：

```markdown
# 資訊收集助手指南

## 我是誰、我要什麼
- 我做銷售，長期關注：客戶公司動態、行業政策、美股。
- 所有產出用中文，存成 Markdown，放到對應目錄。

## 收集鐵律
- 每一條資訊必須附原文連結，無法溯源的不要寫。
- 區分“事實”和“推測”，推測要單獨標出來。
- 優先最近 7 天的資訊，舊資訊要標註日期。
- 輸出統一用表格 + 簡短要點，方便我一眼掃完。

## 目錄約定
- 客戶調研：`02_客戶/<公司名>.md`
- 政策更新：`03_政策/<日期>.md`
- 美股盯盤：`04_美股/<日期>.md`

## 禁止
- 不要編造資料和引用。
- 不要把推測當事實寫。
```

注意這幾條：每一條必須附連結，區分事實與推測，無法溯源就不寫。它們能把 Codex 從會認真胡說的助手，拉回到相對可靠的調研員位置。

小技巧：直接在 Codex 裡敲 `/init`，它會幫你生成一份基礎版 AGENTS.md，你再改。

### 3.2 配幾個順手的別名

不同場景需要不同配置，用別名會省很多事。可以加到 `~/.zshrc`：

```bash
# 日常調研：高推理 + 即時聯網搜尋
alias cx='codex -c model_reasoning_effort="high" --search'

# 唯讀分析：純收集、不改任何檔案，最安全
alias cxr='codex --sandbox read-only --ask-for-approval never --search'

# 腳本/自動化：非互動模式
alias cxx='codex exec'
```

這裡要分清楚權限。`--search` 只讓 Codex 透過官方搜尋 API 聯網，不能直接存取任意 URL。完全網路存取，也就是 Full Access，才會允許它執行 curl 存取任意資源。日常資訊收集一般用 `--search` 就夠了，能查最新內容，也不會把網路權限放得太開。

![這是一張展示系統架構層級的示意圖，強調在進行 AI 代理開發前需先建立基礎架構。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/88455a6a9f5b52a6.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片呈現了一個四層的堆疊結構，每一層對應不同的功能模組，並在底部標註了「先把地基搭好」。各層級文字內容如下：
1. 最上層：Codex 搜索（圖示為放大鏡）
2. 第二層：别名与权限（圖示為終端機指令符號）
3. 第三層：AGENTS.md（圖示為文件檔案）
4. 最底層：文件系统 / Vault（圖示為資料夾）

畫面整體呈現科技感與架構規劃的意象，並非統計圖表或數據比較。</div></details>

## 四、用 MCP 把即時網路接進來

`--search` 解決的是查得到。很多場景還需要更具體的能力：抓某個網頁的結構化資料，用你已登入的瀏覽器讀取頁面，或者呼叫專業行情和新聞資料源。這時就要用 MCP，Model Context Protocol。

MCP 是 Codex 連接外部工具的標準協定。接上之後，Codex 不只是檔案編輯器，也能操作你的資訊工具鏈。

### 4.1 兩種配置方式

Codex 的 MCP 配置在 `~/.codex/config.toml`。常見有兩種加法：

```bash
# 方式一：命令列（適合新手）
codex mcp add context7 -- npx -y @upstash/context7-mcp
codex mcp list      # 查看已配置的

# 方式二：直接編輯 ~/.codex/config.toml（適合老手）
```

```toml
# STDIO 類型（本地工具，如抓取/瀏覽器）
[mcp_servers.brightData]
command = "npx"
args = ["-y", "@brightdata/mcp"]
env = { "API_TOKEN" = "你的token", "PRO_MODE" = "true" }
```

### 4.2 用你已登入的瀏覽器去抓

很多有價值的資訊藏在登入牆後面。這裡有個門檻很低的方案：Playwright MCP 加你現有的瀏覽器會話，不需要額外 API key。

```toml
[mcp_servers.playwright]
command = "npx"
args = ["@playwright/mcp@latest", "--extension"]
```

配好之後，Codex 就能複用你 Chrome 裡已經登入的身分，打開頁面、讀取內容、把結果存進 Markdown。有人就用這招把自己 Linear 裡的待辦任務自動同步進 Obsidian：讓 Codex 打開頁面，等載入，讀取任務標題和編號，再帶連結存成 `Tasks.md`。最後檔案裡看到的內容，和網頁裡看到的基本一致。

把 Linear 任務換成你常看的客戶情報站、需要登入的政策資料庫、券商持倉頁，邏輯是一樣的。

### 4.3 抓網頁結構化資料

如果你要的是把某個頁面抓成乾淨的結構化資料，可以接 Web 類 MCP，比如 Bright Data 這種帶 `search_engine`、`scrape_as_markdown` 工具的。一個真實例子：讓 Codex 抓某商品頁，存成 `product.json`，再寫個腳本讀出來處理。整個過程裡，Codex 自己選工具、自己抓、自己存、自己驗證格式，拿到的是網頁裡的真實資料。

簡單說，`--search` 讓它知道哪裡有資訊，MCP 讓它把資訊拿回來。

### 4.4 別自己造輪子：先看看有沒有公開 Skill

MCP 是底層管道，但你不用每個資料源都自己接。社群裡已經有不少打包好的公開 Skill，裝上就能用。對資訊收集來說，我會優先找那種能覆蓋多個平台的工具，比如 Agent Reach。

Agent Reach 把十幾個平台封裝成 Codex 能直接呼叫的指令：搜尋引擎、小紅書、微博、抖音、B站、推特、Reddit、V2EX、LinkedIn、GitHub、公眾號文章、網頁、RSS、YouTube、播客。裝好之後，你不用關心每個平台怎麼抓、怎麼處理登入，直接跟 Codex 說人話就行：

```
去小紅書和微博搜“XX科技”最近一個月的討論，挑出有資訊量的，帶連結列給我
把這個公眾號最新 3 篇文章讀出來，各總結 5 個要點
看看 Reddit 和推特上關於 NVDA 的討論，情緒偏多還是偏空
```

它會自動呼叫 Agent Reach 去對應平台抓，再按你 AGENTS.md 裡的規矩寫入檔案。這對我那三個場景挺合適：

- 客戶：去小紅書、微博、脈脈、LinkedIn 看公司口碑、員工吐槽、招聘訊號。這些軟資訊在工商資料裡一般看不到；
- 政策：盯相關公眾號和 RSS，自動拉最新發文；
- 美股：掃推特和 Reddit 的討論熱度，補上新聞之外的情緒面。

怎麼找這類公開 Skill：

- 上 mcpmarket.com、ComposioHQ/awesome-codex-skills 這類聚合站，先搜一圈。資訊收集相關的 Skill 已經不少，比如 `research-collector`、`lead-research-assistant`、`content-research-writer`；
- 找到後丟進 `~/.codex/skills/<技能名>/`，重啟 Codex 就會自動識別；
- 嫌麻煩的話，把倉庫連結發給 Codex，讓它幫你裝。

我的習慣是先搜有沒有現成的，再考慮自己接 MCP。別人已經趟過的坑，沒必要再踩一遍。

![這是一張展示「Codex」系統架構的流程圖，說明其如何透過多種數據來源進行資訊整合與處理。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/b35ec0c668e8e54f.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">該圖表展示了「Codex」系統的資料處理流程，分為輸入端、處理核心與輸出端三個部分：

1. **輸入端（左側）：**
   - **Search API**（適合公開資訊）：包含網頁、搜尋引擎、新聞站點。
   - **MCP**（適合深層內容）：包含登錄網站、付費內容、內部系統。
   - **公開 Skill**（適合特定場景）：包含社媒平台、RSS/訂閱、GitHub。
   - 底部總結：Search API（快速、廣覆蓋）、MCP（深入、需鑒權）、公開 Skill（專業、開箱即用）。

2. **處理核心（中央）：**
   - 核心圓形圖示標示為「Codex」，下方註明「去重·提煉·歸檔」。

3. **輸出端（右側）：**
   - 系統處理後產出三個檔案項目，每個項目皆標註「帶來源」：
     - 客戶檔案
     - 政策更新
     - 美股早報</div></details>

## 五、三個日常真實場景

地基搭好了，直接看實戰。下面三個就是我每天真在跑的，Prompt 可以直接抄改。

### 場景一：客戶資訊：多角度背調，每條帶來源

我接觸一個新客戶，最想要的是一份多角度、可溯源的背景檔案。自動網路調研很適合幹這個：多角度搜尋，抽取內容，核驗來源可靠性，再整理成報告。

我的 Prompt 大概長這樣。用 `cxr` 唯讀模式跑，純收集：

```
幫我調研“XX科技有限公司”，從這幾個角度收集最近 6 個月的資訊：
1. 工商與融資：註冊資訊、最新融資、股東變化
2. 業務動態：新產品、新合作、招聘擴張訊號
3. 風險訊號：訴訟、負面新聞、監管處罰
4. 關鍵人物：創始人/高管的公開表態

要求：
- 每條資訊後面附原文連結
- 區分“確認的事實”和“推測”
- 按上面四個角度做成表格
- 最後給我一段 200 字的“銷售切入建議”
存到 02_客戶/XX科技.md
```

它會自己去搜、去讀、去交叉驗證，最後給我一份帶連結的檔案。我只需要審一遍，判斷哪些推測靠譜。決策權還在我手上，但 90% 的體力活省下來了。

進階一點，別讓 Codex 只靠搜尋引擎硬搜。配合前面說的 Agent Reach 去掃小紅書、微博、脈脈、LinkedIn，常能挖到工商資料裡沒有的口碑和內部訊號。再疊一個現成的 `research-collector` 調研 Skill，多角度搜尋和來源核驗可以一起做。

### 場景二：政策資訊：定點抓取，結構化輸出

政策這塊有兩個特點：來源固定，格式要求固定。你關心的通常就那幾個官網和欄目，最後也無非是標題、發文日期、要點、影響。它特別適合用 `exec` 非互動模式加 JSON Schema 輸出，因為格式穩定，後面歸檔和再處理都方便。

```bash
codex exec --json --output-schema policy.schema.json \
  "檢查 [政策來源URL] 最近一週的更新，提取與“資料安全/跨境”相關的文件，
   每條給出：標題、發文單位、日期、3條核心要點、對我業務的潛在影響、原文連結"
```

`codex exec` 是非互動模式，專門給腳本和自動化用。常用參數就這幾個，資訊收集會反覆碰到：

![這張表格列出了五種常用指令參數及其對應的功能說明。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/c06baaaf1aff2cf9.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">該表格整理了五個指令參數及其作用，內容如下：
1. `-o review.md`：結果直接輸出到文件。
2. `--json`：JSON Lines 輸出，方便腳本解析。
3. `--output-schema`：按你給的 JSON Schema 結構化輸出。
4. `--full-auto`：全自動執行（仍在沙箱內，相對安全）。
5. `resume --last`：接著上次的會話繼續。</div></details>

預設情況下，`exec` 跑在唯讀沙盒裡，不會亂改你的檔案。做資訊收集剛好。

### 場景三：美股盯盤：即時新聞 + 行情

美股最講時效，你關心的是昨晚到今天發生了什麼。這塊我一般接兩類 MCP：一類抓即時新聞，有些還帶偏見評分和即時行情，比如 `helium-mcp`；另一類抓指定資料源。

```
我盯這幾隻票：SPCX、NVDA、TSLA、AAPL。
幫我整理過去 24 小時：
1. 每隻票的關鍵新聞（財報/產品/監管/大行評級），帶連結
2. 昨夜收盤表現和盤前異動
3. 有沒有影響我持倉邏輯的重大變化，單獨標紅
按票分組做成表格，存到 04_美股/今天日期.md
```

跑完，一份帶連結的盯盤簡報就進 vault 了。我從自己搜和整理一小時，變成花三分鐘審一份。

## 六、如何讓 Agent 自動值守

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/216b73e098e607b7.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/9d6b5c8eb6253512.jpg" autoplay loop muted playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>

上面三個場景，如果每天都手敲 Prompt，還是累。真正省事的是下面兩步。

### 6.1 第一步：把搜法固化成 Skill

一個 Prompt 反覆用，就該做成 Skill。Skill 本質上是一個 `SKILL.md` 檔案，裡面寫清某個任務的操作規範。放進 `~/.codex/skills/` 目錄後，Codex 遇到相關任務會自動讀取並遵守。

Skill 有一個挺聰明的設計，叫漸進式披露。它分三層載入，不浪費上下文：

- 第一層，元資料：name + description，約 100 字，常駐上下文，Codex 靠它判斷要不要觸發這個技能；
- 第二層，`SKILL.md` 正文：觸發後才載入，通常控制在 5000 字內；
- 第三層，附帶腳本和資源：按需載入，腳本能直接執行，也不會長期佔上下文。

比如把場景一的客戶背調做成 `customer-recon` 技能，以後我只要說“調研 XX 公司”，它就自動按那套規範跑。Skill 的設計原則也別想複雜：一個技能只幹一件事，包含 2 到 3 個用例，輸入輸出和觸發短語寫清楚。

最省事的辦法，是讓 Codex 自己幫你寫 `SKILL.md`。別從零手寫。

### 6.2 讓 Codex 記錄並改進自己的工作流

前面那個燒一萬美金的 OpenAI 研究員，他真正用得狠的地方，不在某個單點技巧上，而在一套習慣上：讓 Codex 持續記錄並改進它自己的工作流。他會讓 Codex 邊幹邊記筆記，把可複用的方法沉澱到一個專屬資料夾。跑幾次之後，這些筆記會穩定下來，Codex 對常做任務會越來越快、越來越準。他說自己從沒讀過那些筆記，價值主要在於讓 Codex 表現更好。

國內也有人驗證過同一招。與其每次從頭教，不如在全域告訴 Codex：

> "在這個專案目錄裡，你要建立一個可複用的沉澱系統。以後類似的任務，自己抽象成流程，不用每次從頭推理。"

然後 Codex 會自己判斷哪些沉澱成 Skill，哪些寫成說明文件，自己設計、自己實現。一次跑通，後面就少很多重複勞動。同一個目錄下的多個會話上下文還能互通，越積累越懂你的工作方式。

### 6.3 第二步：讓它定時自己跑

流程穩定了，就可以上自動化。2026 年 4 月，OpenAI 給 Codex 上了 Automations 功能。你設個時間表，它到點執行，把結果推給你。

三個核心概念：

- 時間表 Schedule：每天、每週或 Cron 表達式，比如 `30 8 * * *`，每天 8:30；
- 觸發器 Trigger：檔案變更、Webhook 等事件觸發；
- 上下文保持 Context Persistence：回到同一對話執行緒，記得上次報告過什麼，只報新增變化。盯盤和追蹤政策更新時，這點很有用。

我的每日早報就是這麼配的：每天早上 8:30，Codex 自動把客戶動態、政策更新、美股要聞三件事跑一遍，輸出一份表格簡報。官方有條建議很實在：先對話，再自動化。先在普通對話裡把任務調到滿意，再儲存成 Automation。

如果你不想依賴官方 Automation，比如要跑在自己伺服器上，用 `codex exec` 加系統 cron 也能做：

```bash
# crontab：每天 8:30 跑資訊收集腳本
30 8 * * * cd ~/vault && codex exec --full-auto -o "04_美股/$(date +\%F).md" "執行美股盯盤技能"
```

注意：本地版 Codex 跑自動化時，你的電腦得保持喚醒。關鍵任務建議放雲端實例。

## 七、進階玩法：一個指揮官帶一隊子 Agent

當你的收集需求變複雜，比如同時要客戶、政策、美股，每塊還要深挖，單執行緒就慢了。

那位 OpenAI 研究員後來的工作流是：只跟一個 Agent 對話，讓它去指揮一隊子 Agent。有人負責搜資料，有人負責讀程式碼，有人負責寫東西，有人負責做資料分析。這樣他不用在多個任務間反覆切換，也能靠並行把效率拉起來。新一代 codex 模型尤其擅長同時管理多個並發子 Agent。

官方 Cookbook 裡也給了範式：用 Agents SDK 把 `codex mcp-server` 當工具，讓一個專案經理 Agent 做總控，按順序把任務分派給各個專職 Agent。每一步都要確認上一步的產物檔案存在，再繼續下一步。放到資訊收集裡，就是主 Agent 拆任務，子 Agent 分別搜客戶、政策、美股，最後由主 Agent 彙總成日報。

另一個常被提到的高效模式叫 4x Codex：先花時間把需求寫清楚，也就是 specs，然後一次起 4 個並發任務跑不同版本。你同時看到幾個結果，補齊遺漏的細節，最後人來驗收。

這些不用一上來就搞。先知道上限在哪，心裡有數就行。

## 八、避坑清單

我把官方和實戰裡反覆踩到的坑集中列出來，可以進行參考：

- Prompt 太模糊。"幫我看看有什麼新聞"每次結果都不一樣。要寫清目標、上下文、約束、完成條件，這是官方提示詞裡最關鍵的四件事；
- 持久規則塞進 Prompt。長期偏好該寫進 AGENTS.md 或 Skill，別每次重複敲；
- 流程還沒穩定就做自動化。頻繁出錯更耗時。先做成 Skill，跑穩定再自動化；
- 權限給太鬆。沒理解流程就開全部權限，有風險。資訊收集優先用 `--sandbox read-only`，純收集不需要改檔案權限；
- 不要求溯源。一定在 AGENTS.md 裡強制每條帶連結、區分事實與推測，否則你拿到的可能是幻覺；
- 上下文撐爆。一個會話別塞太多事，及時 `/compact` 壓縮或 `/new` 開新會話；
- API key 硬編碼。跑自動化時 key 用環境變數或 Secrets，別寫進腳本。

這套方法的核心很簡單：別把資訊收集當成每天必須親自刷一遍的體力活，把它改造成一條 Codex 替你值守的流程。

從手動搜，到教 Codex 搜，到讓它沉澱搜法，再到定時自動跑，你會發現每天省下的一兩個小時，可以拿去做更需要人判斷的事：跟客戶聊、做決策、想策略。

工具會繼續變，模型版本號也會繼續漲。但這套從上下文到 MCP，再到 Skill 和 Automation 的骨架，短期內不會過時。

今天先花十分鐘，配一個最簡單的每日早報跑起來。先動起來，再慢慢調。

關於作者

Kyrie — 前國內大廠 R&D 工程師，現居曼谷，做中國科技企業出海 BD。持續分享出海一線真實記錄、AI 在業務裡的實戰用法，偶爾也聊聊美股投資和國外生活。

- X：.@KyrieCheungYep

## 標籤

Codex, 自動化, 教學資源, Codex, Obsidian