Deep Research Max:自主研究 Agent 的重大變革
AI 語音朗讀 · Edge TTS
Deep Research Max:自主研究 Agent 的重大變革
去年 12 月,我們透過 Interactions API 向開發者發布了 Gemini Deep Research Agent,讓開發者能夠使用 Google 最先進的自主研究功能。今天,我們透過兩款自主研究 Agent 的全新進化版本:Deep Research 與 Deep Research Max,將這些功能提升到新的層次。
隨著我們最先進的模型 Gemini 3.1 Pro 的整合,Deep Research 已從一個精密的摘要引擎,轉變為金融、生命科學、市場研究等領域企業工作流程的基石。Deep Research 的報告不僅本身價值極高,還能作為複雜 Agent 工作流程的第一步,這些流程通常始於深入的背景資訊蒐集。現在,開發者只需呼叫一次 API,就能觸發詳盡的研究工作流程,並首次將開放網路與其專屬資料流結合,產出專業級且具備完整引用的分析報告。
選擇適合你工作流程的研究配置
在 Gemini Deep Research 初版發布的基礎上,我們推出了兩款專為滿足你需求而設計的 Agent,涵蓋從直接使用者協助到大規模離線研究流程的各種場景:
Deep Research:針對速度與效率進行了最佳化。這個新 Agent 取代了我們 12 月發布的預覽版,在提供更高品質的同時,顯著降低了延遲與成本。對於需要整合至互動式使用者介面且對延遲要求較高的研究體驗來說,它是最理想的 Agent。
Deep Research Max:專為追求極致全面性與最高品質綜合分析而設計。Max 利用擴展的測試時間運算(test-time compute)來進行迭代推理、搜尋並精煉最終報告。它是非同步背景工作流程的完美引擎,例如在夜間執行 Cron Job,在隔天早上為分析師團隊產生詳盡的盡職調查報告。

解鎖專屬資料與豐富的原生視覺化內容
Deep Research 現在可以搜尋網路、任意遠端 MCP、上傳的檔案以及已連結的檔案儲存庫(或上述項目的任意組合),這些功能旨在處理專業人士每天依賴的複雜且受限的資料領域。
Model Context Protocol (MCP) 支援:你現在可以透過 MCP 安全地將 Deep Research 無縫連結至你的自訂資料與專業資料流(例如金融或市場資料供應商)。Deep Research 支援任意工具定義,這使其從一個網路搜尋器轉變為能夠導航任何專業資料儲存庫的自主 Agent。
原生圖表與資訊圖表:這是 Gemini API 中 Deep Research 的首創功能,我們的 Agent 不再僅僅產生文字;它能以 HTML 或 Nano Banana 原生產生高品質的圖表與資訊圖表,動態視覺化複雜的資料集,從而豐富分析報告。




我們也擴展了 Agent 的功能,以便在研究過程中提供更多的控制權與透明度:
協作規劃:在 Agent 開始執行之前,你可以審查、引導並精煉它所產生的研究計畫,從而對調查範圍進行細粒度的控制。
擴展工具:結合 Gemini API 的完整工具套件。你可以同時執行 Google 搜尋、遠端 MCP 伺服器、URL Context、程式碼執行與檔案搜尋,或者完全關閉網路存取,僅搜尋你的自訂資料。
多模態研究基礎(Grounding):提供 PDF、CSV、圖片、音訊與影片的組合作為輸入,以你的自訂背景資訊作為 Agent 研究的基礎。
即時串流:透過即時思考摘要追蹤 Agent 的中間推理步驟,並在輸出產生時接收文字與圖片,這對於互動式使用者介面特別有用。
以專家級分析推動實際成果
Deep Research Max 能夠比以往更便宜、更有效率地提供極其全面的報告、嚴謹的事實依據以及專家級的分析。與我們 12 月發布的版本相比,Deep Research Max 諮詢了更多來源,並識別出舊版本經常忽略的關鍵細節。我們也致力於教導 Deep Research 諮詢多樣化的來源,並仔細權衡相互衝突的證據。最終產出的報告不僅細膩,還汲取了 SEC 文件與開放取用同儕審查期刊等權威來源,資訊編排條理分明,並將密集的技術資料轉化為可供利害關係人使用的格式。

為了確保這項技術能帶來實際成果,我們正與金融與生命科學等專業且受監管領域的新創公司與企業密切合作,因為這些領域幾乎不容許錯誤。例如,我們正與 FactSet、S&P 與 PitchBook 積極合作開發其 MCP 伺服器設計,讓共同客戶能將金融資料產品整合至由 Deep Research 驅動的工作流程中,並透過以閃電般的速度蒐集其龐大資料庫中的背景資訊,實現生產力的飛躍。
利用 Google 經過驗證的規模化效能
當你使用 Deep Research Agent 進行開發時,你所利用的是與 Google 部分最熱門產品(如 Gemini App、NotebookLM、Google Search 與 Google Finance)中研究功能相同的自主研究基礎架構。
開始使用 Interactions API 中的 Deep Research
Deep Research 與 Deep Research Max 即日起透過 Gemini API 的付費層級提供公開預覽。請前往我們的開發者文件,開始使用 Interactions API 構建你的 Deep Research 應用。Deep Research 與 Deep Research Max 也將很快開放給 Google Cloud 上的新創公司與企業使用。
