# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Daksh Gupta (@dakshgup) · 平台：X (Twitter) · 日期：2026-06-16

> 原始來源：https://x.com/dakshgup/status/2066536928716235254

## 中文摘要

Greptile 推出 TREX 執行層自動化程式碼審查。

Daksh Gupta 於 2026 年 6 月 15 日正式發表了「TREX (Test-Run-Execute)」，這是一項針對 Greptile 程式碼審查平台的重大升級。過去 Greptile 僅能透過靜態閱讀程式碼來進行審查，而 TREX 的加入讓系統具備了實際執行程式碼的能力，能有效發現那些僅在運行時才會顯現的隱藏錯誤，例如 API 端點錯誤或 UI 渲染異常。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1781580202782-ytqyg69a.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/b157c86e71dcb259.jpg" controls playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> 一名講者介紹名為 TREX 的軟體測試工具，該工具能透過模擬開發環境來自動執行程式碼測試。

**核心功能與技術機制**
TREX 的運作邏輯在於將程式碼審查從「靜態分析」提升至「端到端」的驗證層級，其關鍵技術特點包括：
- **沙盒環境執行**：當 Greptile 審查 PR 時，TREX Agent 會自動啟動一個沙盒環境，針對變更內容進行實際執行與測試。
- **自動化測試流程**：系統能模擬 API 呼叫、啟動開發伺服器，並透過瀏覽器 Agent 進行 UI 點擊操作。
- **無縫整合**：由於 TREX 共享審查上下文（Review Context），使用者無需額外配置或建立複雜的測試架構。
- **證據導向回饋**：系統在報告錯誤時，會附上具體的執行證據，包含日誌（Logs）、螢幕截圖、API 追蹤紀錄、執行腳本，甚至是 UI 變更的影片，讓開發者能直接驗證問題而非僅憑猜測。

**效能表現與使用資訊**
根據官方基準測試，啟用 TREX 後，Greptile 的錯誤捕捉率提升了約 20%。Daksh Gupta 強調，這類錯誤大多無法單靠增加推論（Inference）來發現，必須透過實際的程式碼執行才能捕捉。

- **公開測試**：TREX 現已開放給所有 Greptile 使用者進行公開測試。
- **收費模式**：在 6 月底前可免費使用，之後將改為每次執行收取 2 美元的費用（審查費用另計）。
- **詳細資訊**：使用者可前往 [Greptile 官方部落格](http://www.greptile.com/blog/trex) 了解更多設定細節。

這項功能的推出，標誌著 Greptile 朝向「零錯誤軟體開發」的目標邁進了一大步，為開發者提供了一種更具穩健性的自動化審查解決方案。

## 媒體內容

**一名講者介紹名為 TREX 的軟體測試工具，該工具能透過模擬開發環境來自動執行程式碼測試。**

**影片中的 Prompt 與操作**

操作步驟：

1. @0:07 系統進入沙盒環境執行測試。
2. @0:32 系統模擬輸入並啟動開發伺服器。
3. @0:35 系統使用瀏覽器代理程式進行 UI 互動。
4. @0:39 系統自動定位錯誤代碼並標記註解。

**逐字稿**

- `00:00` 嘿，我是 Shloak，很高興向大家介紹 T-Rex。（Hey, I'm Shloak, and I'm excited to introduce T-Rex.）
- `00:05` Greptile 現在會在沙盒中執行您的 PR 分支，以捕捉隱藏的錯誤。（Greptile now runs your PR branch in a sandbox to catch hidden bugs.）
- `00:09` 如今，Greptile 的程式碼審查 Agent 每月審查數十億行的程式碼，（Today, Greptile's code review agent reviews billions of lines of code）
- `00:12` 並在 NVIDIA、Scale、Brex 和 Whoop 等公司每月捕捉數百萬個錯誤。（and catches millions of bugs a month at companies like NVIDIA, Scale, Brex, and Whoop.）
- `00:19` 但要真正驗證程式碼變更是否有效，您必須實際執行它。（But to truly validate that a code change works, you have to run it.）
- `00:23` 啟用 T-Rex 後，Greptile 能理解您的原生程式開發環境、（With T-Rex enabled, Greptile understands your native coding environment,）
- `00:26` 測試套件以及技術堆疊，從而能夠動態啟動執行您程式碼所需的工具，實現端到端測試。（test suite, and tech stack to be able to dynamically spin up the tools it needs to run your code end-to-end.）
- `00:32` 它能模擬輸入、啟動開發伺服器，甚至使用瀏覽器 Agent 在 UI 上進行點擊操作。（It mocks inputs, spins up dev servers and even uses browser agents to click around the UI.）
- `00:37` 當發現異常時，它會找出根本原因，並在導致問題的確切行數上留下評論。（When something looks off, it finds the root cause and leaves a comment on the exact lines that cause the issue.）
- `00:44` 根據我們的評估，搭載 T-Rex 的 Greptile 比基礎版 Greptile 多捕捉了 20% 的錯誤。（Greptile with T-Rex catches 20% more bugs than base Greptile based on our evals.）
- `00:49` 更令人感興趣的是，如果 Agent 只是閱讀變更內容而非實際執行它們，（What's even more interesting is that those 20% would be nearly impossible to find）
- `00:52` 那 20% 的錯誤幾乎是不可能被發現的。（if the agent was simply reading the changes instead of running them.）
- `00:55` T-Rex 即日起開放公開測試。（T-Rex is now available in public beta today.）
- `00:58` 請造訪 greptile.com/T-Rex 以了解更多資訊。（Visit greptile.com slash T-Rex to learn more.）
- `01:01` 我們很期待聽到大家的想法。（We're excited to hear what you guys think.）

## 標籤

Agent, 新產品, 功能更新, 自動化, Greptile
