# 策展 · X (Twitter) 🔥🔥🔥

> 作者：Guri Singh (@heygurisingh) · 平台：X (Twitter) · 日期：2026-04-25

> 原始來源：https://x.com/heygurisingh/status/2047208428284899704

## 中文摘要

video-use 顛覆影片編輯，Agent 透過 Claude Code 自動生成 final.mp4。影片編輯師恐慌，2.2K 星的開源工具僅需丟素材並下指令，即完成專業剪輯。

**video-use 介紹**  
「video-use」是 browser-use 團隊開源的影片編輯工具，100% 開源，運行於 Claude Code 等 Agent 環境中。使用者只需將原始素材丟入資料夾，輸入如「edit these into a launch video」，即可獲得 `final.mp4`，適用於對談頭像、蒙太奇、教學、旅遊、訪談等內容，無需預設或選單。

**核心功能**  
- 精準剪除填充詞（如「umm」、「uh」、假起頭）和片段間死空  
- 自動為每個片段進行色彩校正（暖色電影風、中性衝擊，或自訂 ffmpeg 鏈）  
- 每個剪切點施加 30ms 音訊淡入淡出，避免爆音  
- 燒錄字幕，自訂風格，預設為 2 字大寫塊  
- 透過 Manim、Remotion 或 PIL 生成動畫疊加，由平行子 Agent 獨立處理，每個動畫一個 Agent  
- 每個剪切前自我評估渲染輸出，僅通過後呈現給使用者  
- 會話記憶持久化於 `project.md`，下週繼續無縫接續  

**安裝與使用**  
貼上設定提示至 Claude Code、Codex、Hermes、Openclaw 等具殼層存取的 Agent，即自動克隆 repo、安裝依賴、註冊 skill，並索取 ElevenLabs API 金鑰（來自 elevenlabs.io）。指向素材資料夾後，下指令即可：Agent 盤點來源、提議策略、待確認後輸出 `edit/final.mp4`，所有產出置於 `<videos_dir>/edit/`。  
手動安裝則克隆至 Agent skill 目錄，執行 `uv sync`、`brew install ffmpeg`（必備）及 `yt-dlp`（選用），編輯 `.env` 加入 ELEVENLABS_API_KEY。

**運作原理**  
LLM 不觀看影片，而是「閱讀」它，透過雙層結構實現字界精準剪輯。  
**Layer 1 — 音訊轉錄（總是載入）**：每個來源一則 ElevenLabs Scribe 呼叫，提供字級時間戳、說話者區分及音訊事件（如 `(laughter)`），打包成單一 ~12KB `takes_packed.md`，LLM 主要閱讀視圖，例如：  
```
## C0103  (duration: 43.0s, 8 phrases)
  [002.52-005.36] S0 Ninety percent of what a web agent does is completely wasted.
  [006.08-006.74] S0 We fixed this.
```  
**Layer 2 — 視覺合成（依需求）**：`timeline_view` 產生膠捲條 + 波形 + 字標 PNG，僅在決策點呼叫，如模糊停頓或剪切檢查。相較天真方法（30,000 畫格 × 1,500 token = 45M token 雜訊），video-use 僅 12KB 文字 + 少量 PNG，類似 browser-use 提供結構化 DOM 而非截圖。

**處理管線**  
```
Transcribe ──> Pack ──> LLM Reasons ──> EDL ──> Render ──> Self-Eval
                                                              │
                                                              └─ issue? fix + re-render (max 3)
```  
自我評估在每個剪切邊界運行 `timeline_view` 於渲染輸出，偵測視覺跳切、音訊爆音、隱藏字幕，僅通過後顯示預覽。

**設計原則**  
- 文字 + 依需求視覺，無畫格傾倒，轉錄為主要介面  
- 音訊優先，視覺跟隨，剪切來自語音邊界與靜默間隙  
- 詢問 → 確認 → 執行 → 自我評估 → 持久化，無策略批准不碰剪切  
- 零內容類型假設，先觀察再編輯  
- 12 條硬規則確保製作正確性，藝術自由則無限（詳見 `SKILL.md`）  

Repo：http://github.com/browser-use/video-use。2.2K 星，開源革命即將讓影片編輯師驚慌失措。

## 標籤

Claude Code, Agent, 開源專案, 自動化, browser-use
