# 策展 · X (Twitter) 🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Liquid AI (@liquidai) · 平台：X (Twitter) · 日期：2026-06-05

> 原始來源：https://x.com/liquidai/status/2062686748291846307

## 中文摘要

Liquid AI 推出 LFM2.5-VL-1.6B-Extract 與 450M-Extract 模型，能直接將影像轉化為結構化 JSON 輸出。

Liquid AI 此次發布的兩款視覺語言模型（Vision-language models），旨在解決傳統視覺模型輸出非結構化文字、需要額外解析層（parsing layer）的痛點。使用者只需在系統提示詞中定義所需的欄位列表，模型即可直接回傳符合格式的 JSON 物件，無需額外的後處理流程。

**核心功能與應用**
這兩款模型屬於「Liquid Nanos」系列，專為生產環境中的特定任務設計，具備以下特點：
- **原生結構化輸出**：直接回傳 JSON，適用於需要穩定結構化輸入的下游系統。
- **輕量化與部署**：提供 1.6B 與 450M 兩種參數規模，適合在各種裝置的 SoC 上執行。
- **應用場景**：
    - 車內駕駛艙狀態理解。
    - 文件自動掃描與資訊提取。
    - 工業檢測與自動化安全系統觸發。
    - 電商產品影像自動標記。

**技術細節與使用方式**
這些模型針對單張影像輸入進行優化，並支援透過 YAML 定義欄位清單。
- **模型規格**：採用 `SigLIP2` 視覺編碼器，支援動態解析度輸入，上下文長度達 128,000 token，並以 `bfloat16` 精度運作。
- **執行建議**：官方建議使用 `transformers` v5.1 或更新版本，並採用貪婪解碼（`temperature=0`）以獲得最穩定的輸出。
- **資源連結**：
    - [LFM2.5-VL-450M-Extract 權重](https://huggingface.co/LiquidAI/LFM2.5-VL-450M-Extract)
    - [LFM2.5-VL-1.6B-Extract 權重](https://huggingface.co/LiquidAI/LFM2.5-VL-1.6B-Extract)
    - [官方技術文件](http://docs.liquid.ai)

**背景脈絡**
Liquid AI 的「Liquid Foundation Models」（LFM）系列強調快速推論與邊緣裝置部署。除了此次推出的 Extract 系列，該生態系還支援多種格式（如 `GGUF`、`MLX`、`ONNX`），並可透過 `TRL` 或 `Unsloth` 進行微調。根據官方評測，這些模型在結構化提取任務中，表現優於同量級的開源視覺語言模型，甚至能與體積大上數倍的模型競爭。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780664096245-pXIAAIAW7jpgnameorig.jpg)
> 根據基準測試結果，Liquid AI 的 LFM2.5-VL-1.6B-Extract 在 VLM Judge Score (90.60)、Schema Consistency F1 (99.60) 及 JSON Validity (99.60) 指標上均表現優異，超越了包含 Qwen3.5-2B 與 InternVL3_5-2B 在內的多款同量級及更大體積的模型。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780664111649-CXIAAIaTljpgnameorig.jpg)
> LFM2.5-VL-450M-Extract 在 VLM 評判分數（84.50）、架構一致性 F1 分數（98.80）及 JSON 有效性（98.90）等指標上，均優於 SmolVLM-500M-Instruct、FastVLM-0.5B、Qwen3.5-0.8B、InternVL3_5-1B 及 MiniCPM-V-4.6 等同類模型。

## 標籤

VLM, 新產品, AIGC, Liquid AI
