# 策展 · X (Twitter) 🔥🔥🔥🔥

> 作者：PostHog (@posthog) · 平台：X (Twitter) · 日期：2026-05-07

> 原始來源：https://x.com/posthog/status/2052051951286665528

## 中文摘要

# PostHog Code 與自動駕駛產品

昨天，我們正式推出了 PostHog Code 的 Beta 版本。

這是一款桌面應用程式，能在你的產品資料之上執行 Agentic 程式開發。

簡單的任務它會自動完成。至於棘手的問題，則會整理成一份優先順序清單，讓你進行決策。

我們開發它的初衷只有一個：實現「自動駕駛產品」。

# 我們如何定義自動駕駛

自動駕駛產品會自動產生 Prompt。

它能理解你的程式庫、資料以及使用者。它會在設定好的安全邊界內，主動提出並完成工作。

自動駕駛中的「自動」，並非指工程師可以完全撒手不管，而是指不再需要以「使用者的指令」作為工作的起點。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778115363953-diaHHo0vTeW0AcDRTjpg.jpg)

自動駕駛產品能讓那些 1% 的效能提升進入「巡航模式」。例如修復 Bug、改善 UX 問題、處理細微瑕疵以及優化轉換率。這些工作雖然會消耗工程師的時間，但通常不需要太多的策略性投入。

而這些工作需要 PostHog 內部的上下文資訊。

在平常的一週內，PostHog 的使用者會產生超過 10 萬筆失敗的查詢，以及約 150 萬個新的錯誤追蹤問題。每一個問題都是一個 Agent 可以處理的訊號。

處理這些訊號不僅僅是寫程式碼。Claude Code、Codex 等工具已經能很好地完成程式撰寫的部分。為了讓它們具備「自動駕駛」能力，我們在上方額外增加了 5 個要素：工具 (Tools)、技能 (Skills)、訊號 (Signals)、記憶 (Memory) 與評估 (Evaluation)。

我們的 AI 工程手冊深入探討了每一個要素，以下是精簡版本。

# 自動駕駛產品的解構

## 1. 工具 (Tools) – Agent 能做什麼

工具是 Agent 可以執行的微小且具體的動作。在 PostHog，我們將其視為原子化的能力，例如 `create_insight` 或 `read_taxonomy`。後者承擔了許多繁重的工作，它讓 Agent 在撰寫查詢或儀表板 PR 之前，能先確認哪些事件與屬性是真實存在的。

## 2. 技能 (Skills) – 如何完成工作

如果工具是刀叉，那麼技能就是食譜。技能將工具、文件與規則串聯成一套行動指南。你可以從我們自己的資料中看出差距：`docs-search` 是 PostHog MCP server 上呼叫次數最多的工具，每月約有 2.8 萬次呼叫。

PostHog Code 針對我們最常見的工作流程提供了對應的技能，例如埋設事件 (instrumenting events)、審核功能旗標 (auditing flags) 以及增加錯誤追蹤。撰寫技能的感覺就像在寫文件，大多數工程師寧願開發功能也不願寫文件。但對 Agent 來說，技能本身就是功能。

## 3. 訊號 (Signals) – 何時該執行工作

工具與技能解決了「做什麼」的問題，而訊號則解決了「何時做」的問題。PostHog Code 運行在你的產品資料之上，因此模式本身就是 Prompt。原始的觀察結果會被分組、豐富化，並轉化為具體的計畫。你打開的是一份預先整理好的待辦清單，而不是在雜亂的收件匣中進行分類。

## 4. 記憶 (Memory) – Agent 已經知道什麼

訊號代表「現在發生了什麼」，而記憶則代表「上次發生了什麼」。如果沒有記憶，Agent 就會重複執行已經做過的工作，並在每個星期二重複開啟同一個 PR。

## 5. 評估 (Evaluation) – 它真的有效嗎？

沒有這個環節，迴圈就無法閉合。測試 AI Agent 與測試一般軟體完全不同，「執行時沒有報錯」並不代表通過測試。

PostHog Code 將評估排程為長時間執行的 Temporal 工作，因此檢查會在 PR 合併後的數小時或數天後執行。系統會重新查詢當初觸發訊號的同一個儀表板、漏斗、實驗或 LLM-as-a-judge 評估。

如果指標沒有改善，或者往錯誤的方向發展，Agent 就會還原變更或重新開啟該工作。

# 產品自主迴圈

將上述所有要素結合起來，就形成了一個我們稱之為「產品自主」的迴圈：

收集資料 → 聚類訊號 → 檢查記憶 → 通知工作人員 → 執行工作 → 審核並發布 → 評估 → 將結果寫回記憶。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778115364003-diaHHo0yfXMAMRoRHjpg.jpg)

你無法在通用的程式撰寫 Agent 中可靠地執行此流程，因為關鍵的訊號存在於其他地方。對許多公司來說，那個「其他地方」就是 PostHog。

## 它在 PostHog Code 中是如何運作的：

錯誤、重播 (replays) 與外部訊號會流入訊號管道，並被聚類為訊號報告。

每個進入你收件匣的任務都會根據緊急程度進行排序，並連結到背景 Agent 所完成的相關上下文與研究。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778115364011-iaHHo1FQcWUAAausZjpg.jpg)

你可以挑選值得處理的任務，並為每個任務選擇合適的模型與 harness。

分割視窗的「指揮中心」(Command Center) 最多可同時處理 9 個 Agent——我們的工程師稱之為「多巴胺模式」（你用過就會明白為什麼）。

長時間的工作會在雲端執行，因此你的筆電效能不會受到影響。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1778115364179-diaHHo1QmWMAk4mE1jpg.jpg)

PostHog 端預設為整合狀態。一鍵埋設功能可以將事件、旗標與實驗直接放入你的程式碼中，無需手動輸入樣板程式碼。

PostHog MCP 負責處理影響力衡量、錯誤除錯與儀表板建立。你可以插入其他的 MCP server 來執行更多動作，或是在開發過程中提取額外的上下文資訊。

## 為什麼你需要這個

當例行工作自動化後，你就有更多空間處理重要事務。你可以自行 Prompt 任務、在完整的產品資料上下文中進行開發，並在自動駕駛工作進行的同時，持續發布新功能。

產品工程師不斷告訴我們，這就是缺失的那一塊拼圖——一個真正理解你的程式庫與產品的 Agent。

這就是我們正在打造的產品。歡迎加入候補名單，體驗試駕。

## 標籤

Agent, 新產品, 自動化, PostHog