# 策展 · X (Twitter) 🔥🔥🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Google AI Studio (@GoogleAIStudio) · 平台：X (Twitter) · 日期：2026-06-25

> 原始來源：https://x.com/GoogleAIStudio/status/2069818951513653618

## 中文摘要

# 在 Gemini 3.5 Flash 中引入電腦操作功能 (Computer Use)

電腦操作功能現在已成為 Gemini 3.5 Flash 內建的支援工具，為 Agentic 程式開發任務提供了我們目前最佳的效能表現。過去，電腦操作功能僅能透過獨立的 Gemini 2.5 電腦操作模型使用，現在則已原生整合至 Gemini Flash 主模型中。Gemini 在函式呼叫 (function calling) 以及使用搜尋 (Search) 和地圖 (Maps) 基礎定位等內建工具方面表現卓越。隨著內建電腦操作能力的加入，開發者現在可以使用 3.5 Flash 來可靠地建構自訂 Agent，使其能夠在瀏覽器、行動裝置和桌面環境中進行觀察、推理並採取行動。這為長週期任務與企業自動化任務（例如持續軟體測試以及跨專業應用程式的知識工作）帶來了效能上的提升。

![Gemini 3.5 Flash 在 OSWorld-Verified 基準測試中取得 78.4 的成績，顯著超越前代 Gemini 3 Flash (65.1) 與 Gemini 3.1 Pro (76.2)，並與 Sonnet 4.6 (78.4) 持平，但仍低於 Opus 4.8 (83.4) 與 GPT-5.5 (78.7)；GPT-5.4 mini 則為 72.1。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/82caeedc64514d97.jpg)

<details class="chart-data"><summary>展開數據表</summary><table><thead><tr><th>模型</th><th>OSWorld-Verified</th></tr></thead><tbody><tr><td>Gemini 3.5 Flash</td><td class="rank-bar num bar-w-90"><span class="bar-val">78.4</span></td></tr><tr><td>Gemini 3 Flash</td><td class="rank-bar num bar-w-80"><span class="bar-val">65.1</span></td></tr><tr><td>Gemini 3.1 Pro</td><td class="rank-bar num bar-w-90"><span class="bar-val">76.2</span></td></tr><tr><td>Sonnet 4.6</td><td class="rank-bar num bar-w-90"><span class="bar-val">78.4</span></td></tr><tr><td>Opus 4.8</td><td class="rank-bar num bar-w-100"><span class="bar-val">83.4</span></td></tr><tr><td>GPT-5.4 mini</td><td class="rank-bar num bar-w-90"><span class="bar-val">72.1</span></td></tr><tr><td>GPT-5.5</td><td class="rank-bar num bar-w-90"><span class="bar-val">78.7</span></td></tr></tbody></table></details>

確保 3.5 Flash 電腦操作功能的安全性

為了減輕 Agent 在即時環境中運作時可能面臨的部分 Prompt 注入風險，我們針對 Gemini 3.5 Flash 的電腦操作功能進行了針對性的對抗性訓練。我們同時發布了兩套選用的企業級安全防護系統，讓企業能夠：

- 針對敏感或不可逆的操作，要求使用者進行明確確認。

- 若偵測到間接 Prompt 注入，自動停止任務。

我們採取「縱深防禦」(defense-in-depth) 的策略，鼓勵開發者將這些功能與安全的沙盒 (Sandbox)、人機協作驗證 (human-in-the-loop verification) 以及嚴格的存取控制相結合。關於安全措施的更多資訊，請參閱我們的最佳實踐文件。

我們已經看到客戶透過電腦操作功能創造了價值。以下是部分客戶的見解：

- Browserbase：「在 OnlineMind2Web 和私有基準測試中，具備電腦操作功能的 Gemini 3.5 Flash 提供了與頂尖模型相當的準確度，且具備更好的成本與延遲表現，使得執行複雜、長週期的瀏覽任務在規模化運作時變得更具經濟效益。」—— Miguel González Fernández，Browserbase

- Browser Use：「Gemini 3.5 Flash 在 Agentic 瀏覽器操作 harness 上，比起前一代 Flash 有顯著的進步。它在保持速度與成本優勢的同時，達到了頂尖水準的效能，這讓 Google 成為我們大規模應用時的首選。」—— Magnus Müller，執行長，Browser Use

- UIPath：「Gemini 3.5 Flash 特別適配於驅動 Delegate 和 ScreenPlay 等 Agent 的 UIPath 電腦操作 harness。在我們評估過的所有電腦操作模型中，Gemini 3.5 Flash 提供了高吞吐量、強大的可靠性以及最佳的性價比，同時還非常容易進行引導與控制。」—— Alvin Stanescu，資深總監，UIPath

立即開始使用電腦操作功能進行開發：

- 立即試用：在 Browserbase 託管的展示環境中測試各項功能。

- 開始建構：透過 Gemini API 與 Gemini Enterprise Agent Platform 深入了解我們的參考實作與文件。

## 標籤

ComputerUse, Agent, 功能更新, Gemini, AIGC, Google, Gemini
