# Liquid AI 發布 LFM2.5-8B-A1B 模型，透過 8B 參數的混合專家架構實現高效能的裝置端 Agent 應用

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 原作者：Liquid AI (@liquidai) · 策展與摘要：EasyVibeCoding · 平台：X (Twitter) · 熱度：🔥 · 日期：2026-05-29

> 原始來源：https://x.com/liquidai/status/2060023455290974474

## 中文摘要

Liquid AI 發布 LFM2.5-8B-A1B 模型，透過 8B 參數的混合專家架構實現高效能的裝置端 Agent 應用。

Liquid AI 於 2026 年 5 月 28 日正式推出「LFM2.5-8B-A1B」模型，這是一款專為行動裝置、筆記型電腦與邊緣運算環境設計的旗艦級混合專家（MoE）模型。該模型在 8B 總參數下僅需 1.5B 啟用參數，並透過 38 兆 token 的預訓練與大規模強化學習，在指令遵循與工具呼叫任務上展現出超越其體積的效能，旨在實現無需雲端 API 即可在單機上運行的完整 Agent 循環。

**核心技術規格與架構**
LFM2.5-8B-A1B 相比前代 LFM2-8B-A1B 有顯著提升，主要技術亮點包括：
- **架構升級**：採用 LFM2.5 旗艦級混合專家架構，結合門控短卷積區塊（Gated Short Convolution Blocks）與分組查詢注意力機制（GQA）。
- **擴展上下文**：上下文視窗從 32K 提升至 128K，支援處理更長的文檔與複雜的推理軌跡。
- **詞彙表擴充**：詞彙表大小從 65K 倍增至 128K，顯著提升了對非拉丁語系（如泰語、印尼語、阿拉伯語等）的標記化效率。
- **推理策略**：採用「僅推理」（Reasoning-only）模式，在最終回答前會顯式生成思維鏈（Chain of Thought），在不犧牲速度的前提下提升任務執行品質。
- **訓練優化**：針對長推理軌跡中的「毀滅循環」（Doom Loops）進行偏好優化，並透過針對性的強化學習減少邊緣模型常見的幻覺問題。

**裝置端 Agent 執行能力**
該模型專為實現「全 Agent 循環」而設計，強調在單一硬體上完成複雜任務：
- **工具呼叫**：具備快速且可靠的工具呼叫能力，能串聯複雜指令。
- **離線運作**：支援完全在本地硬體執行，無需 API 金鑰，確保資料不出機。
- **實務應用**：開源桌面 Agent「LocalCowork」已整合此模型，能在單台筆電上管理 13 個 MCP 伺服器中的 67 種工具，且每次調度延遲遠低於一秒。

**生態系支援與部署**
LFM2.5-8B-A1B 具備極高的部署靈活性，支援多種推理框架與硬體平台：
- **推理框架**：首日即支援 `llama.cpp`、`MLX`、`vLLM`、`SGLang` 及 `ONNX`。
- **硬體相容**：廣泛支援 AMD、Intel、Qualcomm、NVIDIA 及 Apple Silicon 等主流硬體。
- **效能表現**：在 CPU 推理上，於 M5 Max 晶片可達每秒 253 個 token，Ryzen AI Max+ 395 上達 146 個 token；在 GPU 高併發環境下，單張 H100 可達每秒 1.85 萬個輸出 token。

**資源與取得方式**
- **模型權重**：已於 [Hugging Face](https://huggingface.co/LiquidAI/LFM2.5-8B-A1B) 開放下載。
- **技術文件**：詳細資訊請參閱 [Liquid AI 文件中心](http://docs.liquid.ai)。
- **線上測試**：可透過 [Liquid AI Playground](http://playground.liquid.ai) 進行體驗。
- **部署指引**：開發者可參考 `` `docs/` `` 內的說明，了解如何進行本地執行與微調。

## 標籤

Agent, 新產品, LLM, Liquid AI