# JetBrains 發布 Mellum2 實現高效能 AI 工作流程

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 原作者：JetBrains (@jetbrains) · 策展與摘要：EasyVibeCoding · 平台：X (Twitter) · 熱度：🔥 · 日期：2026-06-02

> 原始來源：https://x.com/jetbrains/status/2061444430884675791

## 證據與延伸閱讀

- [JetBrains 2026/6/1 發布 Mellum2](https://jb.gg/zpb9dp)
- [可透過 Hugging Face 取得](https://x.com/jetbrains/status/2061444430884675791)

## 中文摘要

JetBrains 發布 Mellum2 實現高效能 AI 工作流程。

JetBrains 於 2026 年 6 月 1 日正式開源其 12B 參數模型「Mellum2」，該模型由 Anton Semenkin 與 Nikita Pavlichenko 團隊開發，旨在解決生產環境中 AI 系統面臨的延遲、吞吐量與成本瓶頸。相較於初代 Mellum 僅專注於程式碼補全，Mellum2 已進化為能同時處理自然語言與程式碼的通用工具，適用於路由（Routing）、RAG（檢索增強生成）及子 Agent 任務。

**技術架構與效能**
Mellum2 採用「混合專家模型」（Mixture-of-Experts, MoE）架構，在設計上追求極致的效率：
- 參數規模：總參數為 12B，但每個 token 僅啟用 2.5B 參數，大幅降低運算成本。
- 專注化設計：不同於多模態模型，Mellum2 專注於自然語言與程式碼資料，確保在軟體工程環境中具備精簡且快速的表現。
- 效能表現：根據技術報告，Mellum2 在程式碼生成、科學、數學及推理基準測試中，表現與同規模模型相當，但推理時間縮短至不到一半，為生產級部署提供顯著優勢。
- 授權方式：採用 Apache 2.0 授權，支援開發者進行實驗、微調或大規模部署。

**核心應用場景**
JetBrains 將 Mellum2 定位為 AI 工作流程中的關鍵組件，建議用於以下領域：
- 路由與排程：分析輸入的提示詞（prompt），協助選擇最適合該任務的模型或工具。
- 低延遲 RAG 管線：快速總結檢索到的相關背景資訊，並即時生成回應。
- 複雜工作流程的子 Agent：將 Agent 管線拆解為背景收集、規劃與驗證等步驟，利用 Mellum2 處理快速且專門的任務，而非單一依賴大型模型。
- 私有化部署：支援在地端或自行託管，確保程式碼與資料完全處於使用者的控制之下。

**「焦點模型」哲學**
JetBrains 提出「焦點模型」（focal model）理念，認為隨著 AI 系統日益複雜，效能瓶頸已從單純的運算能力轉向大規模部署下的延遲與成本。並非所有任務都需要最強大的模型，許多現代 AI 系統中的步驟具有重複性、高頻率且對延遲敏感的特性，這些環節更適合由快速、可靠且易於調度的模型來執行。JetBrains 強調，未來的 AI 軟體工具將屬於「協調系統」，而非單一模型，Mellum2 正是為了在這些系統中擔任高效、專門的組件而生。

**如何開始使用**
開發者可透過 Hugging Face 取得模型，並將其整合至 IDE、RAG 管線或自建的 Agent 工作流程中。詳細資訊與試用連結請參考：
- [Mellum2 官方介紹頁面](https://jb.gg/zpb9dp)
- [Mellum2 試用連結](https://jb.gg/aw6bhk)

## 標籤

新產品, 開源專案, LLM, Agent, RAG, JetBrains, Mellum2