← 返回首頁

Browser Harness推出自癒式harness,賦予LLM完整自由完成任何瀏覽器任務

Gregor Zunic
Gregor Zunic
@gregpr07
2,890🔁 219
𝕏 (Twitter)🔥🔥
AI 中文摘要Claude 生成

Browser Harness推出自癒式harness,賦予LLM完整自由完成任何瀏覽器任務。

Gregor Zunic推出「Browser Harness」,一個極簡、自癒的harness,直接建構於CDP(Chrome DevTools Protocol),徹底移除瀏覽器框架對LLM的限制,讓Agent能中途編輯helpers.py補齊缺失功能,實現無框架、無預設規則的絕對自由。他挑戰任何人找出辦不到的瀏覽器任務,自己尚未發現,強調這將讓使用者「永遠不再手動使用瀏覽器」。

自癒核心機制
Browser Harness的最大創新在於**自癒(self-healing)**設計:當Agent執行任務時,若helpers.py缺少所需函式,Agent會即時編輯該檔案補上。例如,Agent欲上傳檔案時,發現upload_file()不存在,便直接修改helpers.py(從192行增至199行,新增該函式),任務即成功完成。

  • 無需框架或食譜(recipes),僅一條WebSocket直連Chrome,無中間層阻礙。
  • Agent擁有「完整自由」,可依需求動態擴充工具呼叫,避開傳統框架的束縛。

極簡架構與程式碼規模
整個專案僅約592行Python程式碼,體現「最薄、最簡單」的harness哲學,作者厭倦框架限制LLM,故徹底移除之。

  • install.md:首次安裝與瀏覽器啟動指引。
  • SKILL.md:日常使用說明。
  • run.py(~36行):執行預載helpers的純Python環境。
  • helpers.py(~195行):起始工具函式,Agent可隨時編輯。
  • admin.py + daemon.py(~361行):守護程式啟動、CDP WebSocket與socket橋接。
    這種設計讓LLM如Claude Code或Codex可直接「投遞式整合」(drop-in),無需額外適配。

快速安裝與驗證流程
使用專屬setup prompt,即可讓Agent自動設定:

Set up https://github.com/browser-use/browser-harness for me.

Read `install.md` first to install and connect this repo to my real browser. Then read `SKILL.md` for normal usage. Always read `helpers.py` because that is where the functions are. When you open a setup or verification tab, activate it so I can see the active browser tab. After it is installed, if I am already logged in to GitHub, star this repository as a small verification task; if I am not logged in, just go to browser-use.com.
  • 安裝後,瀏覽器顯示遠端除錯頁面,使用者勾選checkbox授權Agent連接真實瀏覽器。
  • 驗證任務範例:Star this repository,若已登入GitHub則直接星標該repo,否則導向browser-use.com。
  • 另有domain-skills/目錄,提供更多領域特定技能示範。

遠端瀏覽器支援
為子Agent或部署情境設計遠端瀏覽器功能,免費階層提供3個並發瀏覽器,無需信用卡。

開源與哲學立場
100%開源,位於http://github.com/browser-use/browser-harness,直接fork並連結真實瀏覽器。作者立場強烈批判既有Agent框架:「我們厭倦框架限制LLM,所以移除了框架。」連結延伸閱讀如[Bitter lesson](https://browser-use.com/posts/bitter-lesson-agent-frameworks)(苦課:Agent框架的反思)和[Skills](https://browser-use.com/posts/web-agents-that-actually-learn)(真正會學習的網頁Agent),強調無軌道自由才是未來,挑釁式宣稱「找不到辦不到的任務」,凸顯其自信與顛覆性。

此harness不僅解決瀏覽器自動化痛點,更代表AI Agent開發的「苦課」轉向:拋棄框架枷鎖,讓LLM主導自癒演進,預示無限制browser task成為常態。