Of course you could have done this before - but not within your existing sessions (with all your logins etc.) unless you installed a custom extension or whatever.
— Petr Baudis (@xpasky) March 13, 2026
It just works now. (Well, actually it doesn't with the official MCP client if you have hundreds of tabs. I wrote a…
AI 中文摘要Claude 生成
Chrome 146 的推出標誌著一個重要的轉折點。透過簡單的單一切換,使用者現在可以將自己當前的實時瀏覽工作階段透過 MCP 暴露給 CLI Agent,讓 Agent 能直接在該工作階段中執行操作。這對於許多待辦事項(例如處理 LinkedIn 連結申請)提供了全新的工作流程方式。
過去確實可以實現類似功能,但前提是必須在既有的工作階段中進行——也就是保留所有已登入的帳號等狀態——這通常需要安裝自訂延伸功能或進行額外設定。現在則「開箱即用」。儘管如此,該功能在官方 MCP 客戶端上存在實際限制:當標籤頁數量達到數百個時,效能會出現問題。
為了解決這些問題,「chrome-cdp」方案應運而生。它的核心價值在於讓 AI Agent 能看到並互動你的實時 Chrome 工作階段——也就是你已開啟的標籤、已登入的帳號,以及目前的頁面狀態。這些都無需瀏覽器自動化框架、無需獨立的瀏覽器實例,也不必重新登入。
該工具對任何 Chrome 安裝都開箱即用,只需一個切換開關啟用,無需安裝其他組件。大多數瀏覽器自動化工具會啟動全新的隔離瀏覽器,但 chrome-cdp 連接到你正在執行的 Chrome,讓 Agent 能:讀取已登入的頁面(Gmail、GitHub、內部工具等);與你正在積極使用的標籤互動;看到工作流程中間的實際頁面狀態,而非全新重新載入後的狀態。
安裝流程同樣簡單。作為 pi skill,可以執行 `pi install git:github.com/pasky/[email protected]`。對於其他 Agent(Amp、Claude Code、Cursor 等),只需複製 `skills/chrome-cdp/` 目錄到 Agent 載入技能的位置。唯一的執行時間依賴是 Node.js 22 以上版本——無需 npm 安裝。啟用 Chrome 遠端偵錯同樣簡單,只需導航到 `chrome://inspect/#remote-debugging` 並切換開關即可。
CLI 能自動偵測 macOS 和 Linux 上的 Chrome、Chromium、Brave、Edge 和 Vivaldi。如果瀏覽器在非標準位置儲存 `DevToolsActivePort`,可以設定 `CDP_PORT_FILE` 環境變數指向完整路徑。
功能指令包括列出開啟的標籤、擷取螢幕截圖、生成無障礙樹狀結構、提取完整 HTML、在頁面環境中執行 JavaScript、導航到 URL、監測網路資源時序、點擊元素、輸入文字、反覆點擊「載入更多」按鈕直到消失、執行原始 CDP 指令等。
與「chrome-devtools-mcp」相比,chrome-cdp 的優勢明顯。後者在每條指令時都重新連接,導致 Chrome 的「允許偵錯」對話方塊會重複出現,且在多個標籤頁開啟時目標列舉容易逾時。chrome-cdp 則為每個標籤頁維持單一持久的背景程式——對話方塊只出現一次,能可靠地處理 100 多個標籤。該程式會在 20 分鐘無活動後自動結束。
這種方法直接連接到 Chrome 的遠端偵錯 WebSocket,無需 Puppeteer 或任何中介層。正因為這一設計,它能可靠地處理超過 100 個開啟的標籤,而建立在 Puppeteer 基礎上的工具往往會在目標列舉期間超時。
