# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Google AI Studio (@GoogleAIStudio) · 平台：X (Twitter) · 日期：2026-06-23

> 原始來源：https://x.com/GoogleAIStudio/status/2069108412453908791

## 中文摘要

Interactions API 正式發布，成為串接 Gemini 模型核心介面。

Google 宣佈 Interactions API 已結束自 2025 年 12 月以來的公開測試，正式進入一般可用（GA）階段，並成為開發者與 Gemini 模型及 Agent 互動的首選介面。此版本不僅提供穩定的 Schema，更導入了 Managed Agents、背景執行及即將推出的 Gemini Omni 等功能。目前官方文件已全面預設使用 Interactions API，並正與生態系合作夥伴推動其成為第三方 SDK 與函式庫的標準介面。

**開發流程簡化**
Interactions API 的設計目標是透過極簡的程式碼實現模型呼叫或 Agent 執行。開發者僅需傳入模型 ID 進行推論，或傳入 Agent ID 執行自主任務，並透過 `background=True` 參數處理長時任務。

```python
from google import genai

client = genai.Client()

# 與模型互動
interaction = client.interactions.create(
    model="gemini-3.5-flash",
    input="Explain quantum entanglement simply.",
)

# 執行 Agent
interaction = client.interactions.create(
    agent="antigravity-preview-05-2026",
    input="Plot the growth of solar energy generation globally and make some slides in HTML.",
    environment="remote",
)
```

**關鍵功能更新**
自去年 12 月以來，該 API 進行了多項重大升級：
- Managed Agents：透過單一 API 呼叫即可配置遠端 Linux 沙盒，讓 Agent 進行推理、執行程式碼、瀏覽網路及管理檔案。預設搭載 Antigravity Agent，開發者亦可自定義包含指令、skill 與資料來源的專屬 Agent。
- 背景執行：設定 `background=True` 即可讓伺服器以非同步方式處理互動。
- 工具整合：支援在單一請求中混合使用內建工具（如 Google Search、Google Maps）與自定義函式，且工具結果現可回傳圖像與文字。
- Deep Research 升級：提供速度與深度兩種 Agent 版本，支援協作規劃、原生圖表與資訊圖表生成，以及針對圖像、PDF 與音訊的多模態 grounding。
- 媒體生成：整合 Nano Banana 2 圖像生成（結合 Google Image Search 接地）、Lyria 3 音樂生成，以及具備多說話者功能的 TTS。
- 結構調整：將舊有的角色結構簡化為「步驟（Steps）」Schema，每個動作（如 `user_input`、`thought`、`function_call`、`model_output` 等）皆為具備型別的獨立步驟。
- 成本與開發優化：提供 Flex 與 Priority 兩種層級，Flex 層級可降低 50% 成本；錯誤訊息現可精確定位至特定欄位；付費層級支援 55 天的互動紀錄檢索。

**開發標準的轉移**
Interactions API 現已成為 Google AI Studio 與 Gemini API 的預設介面。雖然舊有的 `generateContent` API 將持續獲得支援並更新主流 Gemini 模型，但 Google 明確表示，針對長時執行模型與 Agent 的前瞻性功能，未來將優先或僅在 Interactions API 上推出，因為該介面是專為具備狀態的 Agentic 工作流所設計。

**Agent 優先的生態系**
為了協助開發者更順利地將 Agent 與最新的 API 模式整合，Google 推出了 `gemini-interactions-api` skill。該 skill 能將串流、函式呼叫、結構化輸出及 Deep Research 等最佳實踐模式注入 Agent 的上下文（Context）中。

```bash
npx skills add google-gemini/gemini-skills --skill gemini-interactions-api
```

**入門指引**
Interactions API 現已透過 Python 與 JavaScript SDK 提供支援。開發者可透過 Google AI Studio 取得 API Key，並參考官方文件開始使用。針對從 `generateContent` 遷移的開發者，官方提供了遷移指南以對應新舊 Schema，完整 OpenAPI 規格亦已公開。開發者可透過官方開發者論壇回饋需求，持續影響該 API 的發展方向。

## 標籤

Gemini, SDK, Agent, 功能更新, 新產品, Google, Gemini
