# 策展 · X (Twitter) 🔥🔥🔥

> 作者：Google for Developers (@googledevs) · 平台：X (Twitter) · 日期：2026-05-06

> 原始來源：https://x.com/googledevs/status/2051773542513947092

## 中文摘要

Gemini Embedding 2 透過 Matryoshka 技術實現 AI 效率躍進。

Google 於 2026 年 4 月 30 日宣布 Gemini Embedding 2 正式上市（GA），這是 Gemini API 首個將文字、圖像、影片、音訊與文件映射至單一嵌入空間的多模態模型，支持超過 100 種語言。該模型利用 Matryoshka Representation Learning (MRL) 技術，讓開發者動態截斷 3072 維向量，實現高速候選匹配、降低資料庫成本，並適應任意延遲預算與精準度需求。

**模型核心規格**  
Gemini Embedding 2 單次呼叫可處理廣泛輸入：  
- 最多 8,192 個文字 token  
- 6 張圖像  
- 120 秒影片  
- 180 秒音訊  
- 6 頁 PDF 文件  

透過將不同模態映射至相同語意空間，開發者能建構「看見」與「聽見」專有資料的應用。其真正優勢在於處理交錯輸入（如文字與圖像組合），提供單一請求下的整體理解。若需個別輸入的獨立嵌入，可使用即將支援 Agent Platform 的 Batch API。

**Agentic 多模態 RAG**  
多模態嵌入讓 AI Agent 執行多步驟推理任務，例如掃描數百檔案修復程式碼庫，或交叉比對分散 PDF，提升理解與精準度。使用 Gemini API 建構管道時，透過任務前綴（task prefixes）優化嵌入，依 Agent 目標橋接短查詢與長文件。  
在索引時與查詢時皆套用前綴，可大幅提升檢索精準度。  
實際案例：  
- 法律研究平台 [Harvey](http://goo.gle/embedding2) 採用後，在法律特定基準上 Recall@20 精準度提升 3%，帶來更準確的引用與答案。  
- Supermemory 的「記憶向量資料庫」整合後，搜尋 Recall@1 精準度提升 40%，驅動索引、搜尋與問答的核心檢索管道表現。

**多模態搜尋**  
Gemini Embedding 2 可用於基於多模態輸入的資料搜尋工具，使用前綴 `"task: search result | query: {content}"`。  
案例：URBN 服飾租賃公司 [Nuuly](http://goo.gle/embedding2) 內部視覺搜尋工具，將倉庫地板照片比對商品目錄識別未標記衣物，Match@20 精準度從 60% 躍升至近 87%，總成功識別率從 74% 提升至超過 90%。

**搜尋重排序**  
在檢索管道中，使用嵌入計算距離指標（如餘弦相似度或點積分數）重排序初始結果，找出最佳答案。方法為提示模型以內部知識產生基線假設答案，嵌入該模板並與檢索資料比較相似度分數，排序最精準且脈絡豐富的匹配。

**叢集、分類與異常偵測**  
嵌入可用於依相似度建立叢集，掌握資料關係，快速辨識隱藏趨勢或離群值，成為情緒分析與異常偵測基礎。此為對稱使用情境，查詢與文件使用相同任務前綴。

**高效儲存與使用**  
嵌入可儲存於 [Agent Platform Vector Search](http://goo.gle/embedding2)、Pinecone、Weaviate、Qdrant 或 ChromaDB 等向量資料庫。  
Gemini Embedding 2 經 MRL 訓練，可透過 `output_dimensionality` 參數將預設 3072 維向量截斷至較小維度（建議 1536 或 768 以達最高效率），維持高精準度同時降低成本。Batch API 提供 50% 預設嵌入價格的更高吞吐量。

**起步指南**  
開發者可立即在 [Gemini API](http://goo.gle/embedding2) 或 Agent Platform 探索模型，建構 Agentic 多模態 RAG、視覺搜尋等應用。Google 期待此原生多模態嵌入如何提升跨產業複雜資料理解。更多細節見 [官方文件](http://goo.gle/embedding2)。

## 標籤

Embedding, 新產品, 功能更新, Google, Gemini
