Google Gemma 4 26B A4B 模型現已登陸 Workers AI 平台
AI 語音朗讀 · Edge TTS
Google Gemma 4 26B A4B 模型現已登陸 Workers AI 平台。
Cloudflare 與 Google 合作,將 Gemma 4 26B A4B 模型引入 Workers AI,這是一款基於 Gemini 3 研究成果的「MoE (Mixture-of-Experts)」模型,旨在以極高的運算效率提供前沿效能。
模型架構與效能
Gemma 4 26B A4B 採用 MoE 架構,總參數為 26B,但在每次前向傳遞中僅啟用 4B 參數。這種設計讓模型在保持大型模型品質的同時,運算速度幾乎與 4B 參數模型相當,實現了極高的「參數智慧比」。其核心架構包含 128 個專家模型中的 8 個活躍專家(加上 1 個共享專家),大幅降低了運算成本。
關鍵技術能力
該模型具備多項進階功能,適合構建高效的 Agent:
- 256k 的 context window:支援保留完整的對話歷史、工具定義及長篇文件。
- 內建思考模式:允許模型在回答前進行逐步推理,提升複雜任務的準確度。
- 視覺理解能力:支援物件偵測、文件與 PDF 解析、UI 理解、圖表分析、OCR(含多語言與手寫辨識),並支援多種長寬比與解析度。
- 原生工具呼叫:支援結構化工具使用,便於執行 Agent 工作流與多步驟規劃。
- 多語言與程式撰寫:預訓練涵蓋 140 多種語言,並原生支援 35 種以上語言,同時具備程式碼生成、補全與修正能力。
整合與使用方式
開發者可透過 Workers AI 綁定 (env.AI.run())、REST API (/run 或 /v1/chat/completions),或使用與 OpenAI 相容的介面來呼叫此模型。
Gemma 4 just landed on the edge on Workers AI!
— Cloudflare Developers (@CloudflareDev) April 4, 2026
💎 MoE model with 26B and 4B active, for fast inference
💎 Tool calling, reasoning, vision capabilities. Generates code and is multilingual
💎 256k context window and Chat Completions compatible API
💎 Perfect for building fast…
