← 返回首頁

Google Gemma 4 26B A4B 模型現已登陸 Workers AI 平台

Cloudflare Developers
Cloudflare Developers
@CloudflareDev
423🔁 32
𝕏 (Twitter)🔥🔥🔥🔥

AI 語音朗讀 · Edge TTS

AI 中文摘要Claude 生成

Google Gemma 4 26B A4B 模型現已登陸 Workers AI 平台。

Cloudflare 與 Google 合作,將 Gemma 4 26B A4B 模型引入 Workers AI,這是一款基於 Gemini 3 研究成果的「MoE (Mixture-of-Experts)」模型,旨在以極高的運算效率提供前沿效能。

模型架構與效能
Gemma 4 26B A4B 採用 MoE 架構,總參數為 26B,但在每次前向傳遞中僅啟用 4B 參數。這種設計讓模型在保持大型模型品質的同時,運算速度幾乎與 4B 參數模型相當,實現了極高的「參數智慧比」。其核心架構包含 128 個專家模型中的 8 個活躍專家(加上 1 個共享專家),大幅降低了運算成本。

關鍵技術能力
該模型具備多項進階功能,適合構建高效的 Agent:

  • 256k 的 context window:支援保留完整的對話歷史、工具定義及長篇文件。
  • 內建思考模式:允許模型在回答前進行逐步推理,提升複雜任務的準確度。
  • 視覺理解能力:支援物件偵測、文件與 PDF 解析、UI 理解、圖表分析、OCR(含多語言與手寫辨識),並支援多種長寬比與解析度。
  • 原生工具呼叫:支援結構化工具使用,便於執行 Agent 工作流與多步驟規劃。
  • 多語言與程式撰寫:預訓練涵蓋 140 多種語言,並原生支援 35 種以上語言,同時具備程式碼生成、補全與修正能力。

整合與使用方式
開發者可透過 Workers AI 綁定 (env.AI.run())、REST API (/run/v1/chat/completions),或使用與 OpenAI 相容的介面來呼叫此模型。