# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Google DeepMind (@GoogleDeepMind) · 平台：X (Twitter) · 日期：2026-05-20

> 原始來源：https://x.com/GoogleDeepMind/status/2056826903957504136

## 中文摘要

Google DeepMind 發表 Gemini 3.5 Flash，結合前沿智慧與行動能力，推動 Agent 程式開發邁向新階段。

Google DeepMind 於 2026 年 5 月 19 日正式推出 Gemini 3.5 系列模型，首發的 3.5 Flash 旨在將頂尖的推理能力與實際執行力結合，不僅提升了 Agent 處理長週期任務的效率，更在程式撰寫與多模態理解上達到新高度。此模型現已全面開放，並將作為 Google 生態系統中各項 Agent 服務的核心驅動力。

**核心效能與技術突破**
Gemini 3.5 Flash 在多項關鍵指標上展現了超越前代旗艦模型的實力，並維持了 Flash 系列一貫的高速表現：
- 效能指標：在「Terminal-Bench 2.1」取得 76.2% 的成績，於「GDPval-AA」達到 1656 Elo，並在「MCP Atlas」獲得 83.6% 的評分。
- 多模態能力：在「CharXiv Reasoning」測試中達到 84.2% 的準確率。
- 運算速度：輸出 token 的速度比其他前沿模型快 4 倍，在「Artificial Analysis」索引中位居右上象限，證明高品質與低延遲不再需要二選一。

**Agent 程式開發與大規模應用**
透過與更新後的「Antigravity」harness 整合，3.5 Flash 成為部署協作式子 Agent 的強大引擎，能處理複雜且跨步驟的任務：
- 長週期任務：將原本需數日甚至數週的開發或審計工作，縮短至極短時間內完成，且成本通常低於其他前沿模型的一半。
- 協作機制：在監督下，模型能可靠地執行多步驟工作流程，並在維持前沿效能的同時，生成更豐富且具互動性的網頁介面與圖形。

**實際產業影響與案例**
多家企業已將 3.5 Flash 導入其工作流程，解決複雜的自動化需求：
- Shopify：並行執行子 Agent，分析長週期資料以提升全球商家成長預測的準確度。
- Macquarie Bank：透過推理超過 100 頁的複雜文件，加速客戶開戶流程並提供可靠建議。
- Salesforce：將模型整合至「Agentforce」，透過部署多個子 Agent 來自動化企業級任務，並維持上下文與多輪工具呼叫的穩定性。
- Ramp：結合複雜發票的多模態理解與歷史模式推理，實現更聰明、可靠的 OCR 處理。
- Xero：自主管理如識別供應商及蒐集 1099 稅務表單資訊等繁瑣行政流程。
- Databricks：利用 Agent 工作流程監控即時資訊，並在海量資料集中進行診斷與修復建議。

**個人化 Agent 與安全性**
3.5 Flash 現已成為全球 Gemini App 與 Google 搜尋「AI Mode」的預設模型，並驅動全新的個人 AI Agent「Gemini Spark」。該 Agent 可 24 小時運作，協助使用者管理數位生活。此外，Gemini 3.5 遵循「Frontier Safety Framework」，強化了網路與 CBRN（化學、生物、放射性及核子）防護，並引入可解釋性工具，在回應前檢查 AI 的內部推理過程，以減少有害內容生成或錯誤拒絕回答安全查詢的情況。

**取得方式與資源**
開發者與企業可透過以下管道使用 Gemini 3.5 Flash：
- 開發者平台：[Google Antigravity](https://goo.gle/3PwoinZ) 以及 Google AI Studio 與 Android Studio 中的 Gemini API。
- 企業應用：Gemini Enterprise Agent Platform 與 Gemini Enterprise。
- 一般使用者：Gemini App 與 Google 搜尋中的 AI Mode。

Google DeepMind 同時預告，效能更強大的 3.5 Pro 模型目前已在內部測試中，預計將於下個月正式推出。

## 標籤

Gemini, Agent, 新產品, 功能更新, Google, DeepMind, Gemini