# Liquid AI 推出 LFM2.5-VL-1.6B-Extract 與 450M-Extract 模型，能直接將影像轉化為結構化 JSON 輸出

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 原作者：Liquid AI (@liquidai) · 策展與摘要：EasyVibeCoding · 平台：X (Twitter) · 熱度：🔥 · 日期：2026-06-05

> 原始來源：https://x.com/liquidai/status/2062686748291846307

## 證據與延伸閱讀

- [Liquid AI 推出 LFM2.5-VL 模型](https://x.com/liquidai/status/2062686748291846307)
- [屬於 Liquid Nanos 系列](https://huggingface.co/LiquidAI/LFM2.5-VL-450M-Extract)
- [模型規格與技術參數](https://huggingface.co/LiquidAI/LFM2.5-VL-1.6B-Extract)
- [生態系支援多種格式](http://docs.liquid.ai/)

## 中文摘要

Liquid AI 推出 LFM2.5-VL-1.6B-Extract 與 450M-Extract 模型，能直接將影像轉化為結構化 JSON 輸出。

Liquid AI 此次發布的兩款視覺語言模型（Vision-language models），旨在解決傳統視覺模型輸出非結構化文字、需要額外解析層（parsing layer）的痛點。使用者只需在系統提示詞中定義所需的欄位列表，模型即可直接回傳符合格式的 JSON 物件，無需額外的後處理流程。

**核心功能與應用**
這兩款模型屬於「Liquid Nanos」系列，專為生產環境中的特定任務設計，具備以下特點：
- **原生結構化輸出**：直接回傳 JSON，適用於需要穩定結構化輸入的下游系統。
- **輕量化與部署**：提供 1.6B 與 450M 兩種參數規模，適合在各種裝置的 SoC 上執行。
- **應用場景**：
    - 車內駕駛艙狀態理解。
    - 文件自動掃描與資訊提取。
    - 工業檢測與自動化安全系統觸發。
    - 電商產品影像自動標記。

**技術細節與使用方式**
這些模型針對單張影像輸入進行優化，並支援透過 YAML 定義欄位清單。
- **模型規格**：採用 `SigLIP2` 視覺編碼器，支援動態解析度輸入，上下文長度達 128,000 token，並以 `bfloat16` 精度運作。
- **執行建議**：官方建議使用 `transformers` v5.1 或更新版本，並採用貪婪解碼（`temperature=0`）以獲得最穩定的輸出。
- **資源連結**：
    - [LFM2.5-VL-450M-Extract 權重](https://huggingface.co/LiquidAI/LFM2.5-VL-450M-Extract)
    - [LFM2.5-VL-1.6B-Extract 權重](https://huggingface.co/LiquidAI/LFM2.5-VL-1.6B-Extract)
    - [官方技術文件](http://docs.liquid.ai)

**背景脈絡**
Liquid AI 的「Liquid Foundation Models」（LFM）系列強調快速推論與邊緣裝置部署。除了此次推出的 Extract 系列，該生態系還支援多種格式（如 `GGUF`、`MLX`、`ONNX`），並可透過 `TRL` 或 `Unsloth` 進行微調。根據官方評測，這些模型在結構化提取任務中，表現優於同量級的開源視覺語言模型，甚至能與體積大上數倍的模型競爭。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780664096245-pXIAAIAW7jpgnameorig.jpg)
> 根據基準測試結果，Liquid AI 的 LFM2.5-VL-1.6B-Extract 在 VLM Judge Score (90.60)、Schema Consistency F1 (99.60) 及 JSON Validity (99.60) 指標上均表現優異，超越了包含 Qwen3.5-2B 與 InternVL3_5-2B 在內的多款同量級及更大體積的模型。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780664111649-CXIAAIaTljpgnameorig.jpg)
> LFM2.5-VL-450M-Extract 在 VLM 評判分數（84.50）、架構一致性 F1 分數（98.80）及 JSON 有效性（98.90）等指標上，均優於 SmolVLM-500M-Instruct、FastVLM-0.5B、Qwen3.5-0.8B、InternVL3_5-1B 及 MiniCPM-V-4.6 等同類模型。

## 媒體內容

**根據基準測試結果，Liquid AI 的 LFM2.5-VL-1.6B-Extract 在 VLM Judge Score (90.60)、Schema Consistency F1 (99.60) 及 JSON Validity (99.60) 指標上均表現優異，超越了包含 Qwen3.5-2B 與 InternVL3_5-2B 在內的多款同量級及更大體積的模型。**

**數據表**

|   | VLM Judge Score | Schema Consistency F1 Score | JSON Validity |
| --- | --- | --- | --- |
| LFM2.5-VL-1.6B-Extract | 90.60 | 99.60 | 99.60 |
| LFM2.5-VL-1.6B | 66.00 | 75.80 | 91.80 |
| FastVLM-1.5B | 50.90 | 80.30 | 87.30 |
| SmolVLM2-2.2B-Instruct | 64.80 | 82.90 | 84.40 |
| Qwen3.5-2B | 89.70 | 97.70 | 97.90 |
| gemma-4-E2B-it | 84.40 | 97.10 | 97.40 |
| InternVL3_5-2B | 87.70 | 99.20 | 99.60 |

**LFM2.5-VL-450M-Extract 在 VLM 評判分數（84.50）、架構一致性 F1 分數（98.80）及 JSON 有效性（98.90）等指標上，均優於 SmolVLM-500M-Instruct、FastVLM-0.5B、Qwen3.5-0.8B、InternVL3_5-1B 及 MiniCPM-V-4.6 等同類模型。**

**數據表**

|   | LFM2.5-VL-450M-Extract | LFM2.5-VL-450M | SmolVLM-500M-Instruct | FastVLM-0.5B | Qwen3.5-0.8B | InternVL3_5-1B | MiniCPM-V-4.6 |
| --- | --- | --- | --- | --- | --- | --- | --- |
| VLM Judge Score vs Size (B) | (0.45, 84.50) | (0.45, 73.40) | (0.5, 12.20) | (0.8, 16.30) | (0.85, 82.30) | (1.0, 80.70) | (1.3, 57.50) |
| VLM Judge Score | 84.50 | 73.40 | 12.20 | 16.30 | 82.30 | 80.70 | 57.50 |
| Schema Consistency F1 Score | 98.80 | 93.50 | 26.60 | 19.30 | 96.30 | 96.50 | 60.40 |
| JSON Validity | 98.90 | 97.70 | 33.00 | 22.50 | 96.40 | 98.00 | 61.80 |

## 標籤

VLM, 新產品, AIGC, Liquid AI