← 返回首頁
Philipp Schmid
Philipp Schmid
@_philschmid
𝕏 (Twitter)🔥🔥
AI 中文摘要Claude 生成

Gemini 互動 API 現已支援在單一請求中結合內建工具與自訂函式,使 Agent 能夠自動決定工具呼叫順序並在工具間循環傳遞資料,大幅簡化複雜多工作流程的編排。

功能核心改進

過去建立有用的 Agent 需要多個工具協作時,開發者必須自行編排工具間的交接邏輯,或放棄使用內建工具而仰賴自訂工具。Gemini 互動 API 的工具組合功能解決了這個困境,允許在同一請求中:

  • 同時聲明內建工具(如「Google 搜尋」、「URL 內容擷取」)與自訂函式
  • 讓模型自動決定呼叫哪些工具、以何種順序執行
  • 在工具間自動循環傳遞資料,無需手動管理上下文

實踐案例一:DevOps 安全性工作流

第一個範例展示 Agent 搜尋 React 框架的最新關鍵漏洞。模型執行流程為:搜尋網路 → 讀取完整諮詢頁面 → 呼叫自訂的 file_incident 函式登記安全事件。實際輸出顯示模型識別出 CVE-2025-55182(React Server Components 反序列化漏洞),自動分類為「關鍵」嚴重程度,並生成包含受影響版本(React 19.0、19.1.x、19.2.0)與補丁資訊(19.0.1、19.1.2、19.2.1)的摘要,最終觸發 file_incident 函式完成事件登記。此流程展現 Agent 無需顯式指令即可智慧銜接多個工具的能力。

上下文跨輪循環機制

第二個功能是「上下文循環保留」,使 Agent 能在多輪對話中重用先前工具的執行結果。開發者通過傳遞 previous_interaction_id 參數,讓後續提問能推理早前的資料而無需重新執行工具。範例中,第一輪使用 URL 內容擷取讀取 Philipp Schmid 個人頁面,第二輪後續詢問「他的 X(Twitter)帳號是什麼」時,模型可基於第一輪結果進行推理。值得注意的是,模型仍保有靈活性——若判斷需要新資料或認為必要時,仍可主動發起新的工具呼叫。

技術易用性

實現此功能僅需安裝 google-genai SDK,使用 gemini-3-flash-preview 模型。開發者定義自訂函式時,只需按 OpenAPI 規範聲明函式名稱、描述與參數結構,模型即可自動理解與調用。相比以往需要手寫編排邏輯的方案,這種方法大幅降低多工具 Agent 的開發複雜度。