← 返回首頁

Google DeepMind推出Deep Research API重大升級

Logan Kilpatrick
Logan Kilpatrick
@OfficialLoganK
1,621🔁 129
𝕏 (Twitter)🔥🔥🔥🔥🔥

AI 語音朗讀 · Edge TTS

AI 中文摘要Claude 生成

Google DeepMind推出Deep Research API重大升級,包括Deep Research Max與多項新功能,大幅提升自主研究Agent效能。

Google DeepMind於2026年4月21日宣布Deep Research API重大升級,從去年12月的預覽版演進為企業級工具,整合Gemini 3.1 Pro模型,將原本的摘要引擎轉型為金融、生醫與市場研究等領域的基礎工作流程,透過單一API呼叫融合開放網路與專有資料流,產生專業級、完整引用的分析報告。

Deep Research與Max兩款Agent選擇
DeepMind推出兩款Agent,針對不同需求優化:

  • Deep Research:取代去年12月預覽版,延遲大幅降低、成本減少,品質更高,適合整合至互動使用者介面,需要低延遲的研究體驗。
  • Deep Research Max:強調最大全面性與最高品質合成,利用延長測試時計算,反覆推理、搜尋與精煉報告,理想用於非同步背景工作,如夜間cron job產生盡職調查報告。

Deep Research Max效能躍升
Deep Research Max在產業標準基準測試中,檢索與推理能力大幅躍進,相較去年12月版本,參考來源更多、辨識關鍵細微差異更精準,且能權衡衝突證據,產生細膩報告,引用如SEC文件與開放同行評審期刊等權威來源,將密集技術資料轉化為可行動、利害關係人友善格式。

解鎖專有資料與原生視覺化
Deep Research現可搜尋網路、任意遠端MCP、檔案上傳與連結檔案儲存,或其子集,處理專業人士依賴的複雜封閉資料環境:

  • Model Context Protocol (MCP) 支援:安全連結自訂資料與專業資料流(如金融或市場資料供應商),支援任意工具定義,將其從網路搜尋者轉為能導航專門資料儲存庫的自主Agent。
  • 原生圖表與資訊圖:首次在Gemini API中,Agent不僅產生文字,還原生生成高品質圖表與資訊圖,內嵌HTML或Nano Banana,動態視覺化複雜資料集,提升分析報告豐富度。

擴展控制與透明度功能
新增功能提供更多研究流程掌控:

  • 協作規劃模式:在執行前審核、引導與精煉Agent產生的研究計劃,精細控制調查範圍。
  • 完整工具支援:整合Gemini API全套工具,同時執行Google搜尋、遠端MCP伺服器、URL脈絡、程式碼執行與檔案搜尋,或完全關閉網路存取,專注自訂資料。
  • 多模態研究基礎:輸入PDF、CSV、圖像、音訊與影片組合,為Agent研究提供自訂脈絡。
  • 即時進度串流:追蹤Agent中間推理步驟,透過即時思考摘要接收文字與圖像輸出,特別適合互動使用者介面。

實際應用與合作成果
Deep Research Max提供高全面報告、嚴謹事實性與專家級分析,更廉價高效。Google DeepMind與金融、生醫等高風險領域新創與企業緊密合作,如與FactSet、S&P Global及PitchBook合作設計MCP伺服器,讓共享客戶整合金融資料至Deep Research工作流程,實現資料宇宙高速脈絡收集,提升生產力。此技術背後基礎設施,也驅動Gemini App、NotebookLM、Google Search與Google Finance等熱門產品的研究功能。

Deep Research與Deep Research Max自即日起於Gemini API付費層公測可用,開發者可透過Interactions API文件開始建置,Google Cloud內新創與企業版即將推出。此為Deep Research Agent旅程的開端,預期將持續演進。