# 策展 · X (Twitter) 🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Mistral AI (@MistralAI) · 平台：X (Twitter) · 日期：2026-06-25

> 原始來源：https://x.com/MistralAI/status/2069420263825895917

## 中文摘要

Mistral AI 發布 Mistral OCR 4 強化結構化解析。

**核心功能與技術優勢**
Mistral OCR 4 不僅是單純的文字提取工具，更是一套能將文件轉化為結構化資料的系統。其關鍵技術特點包括：
- **結構化輸出**：能精確定位每個區塊的邊界框（Bounding Box），並將內容分類為標題、表格、方程式或簽名等類型。
- **置信度評分**：提供頁面級與字詞級的置信度分數，協助使用者評估資料可靠性，進而優化 RAG 檢索、敏感資訊遮蔽及人工審核流程。
- **多語言支援**：支援 170 種語言，特別在稀有與低資源語言的表現上，顯著優於其他競爭系統。
- **部署彈性**：模型設計輕量，可於單一容器（Container）內完整執行，確保企業能將文件資料保留在自有環境中，滿足資料主權與隱私合規需求。

**效能表現與評測**
根據 Mistral AI 的盲測數據，在針對 12 種語言、超過 600 份真實文件進行的評比中，獨立評測員在多數情況下均偏好 OCR 4 的輸出，平均勝率達 72%。在公開基準測試中，OCR 4 於「OlmOCRBench」取得 85.20 分，並在內部多語言評測中領先。Mistral AI 指出，現有自動化基準測試常因地面實況（Ground-truth）錯誤、數學符號格式差異或閱讀順序判定等因素產生偏差，因此建議使用者應以實際文件進行評估。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/35daf8a668d95da4.jpg)
> Mistral OCR 4 在 OlmOcrBench 公開基準測試中以 85% 的準確率奪冠，並在 Crawl Multilingual 內部多語言評估中以 98% 的準確率領先其他競爭模型。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/113752802b5a9e7a.jpg)
> 根據盲測評估，Mistral OCR 4 在與各大競爭對手的對決中均取得顯著優勢，勝率介於 65.7% 至 82.3% 之間，全面領先所有測試系統。

**應用場景與整合**
OCR 4 旨在作為 Agent 與自動化流程的基礎組件，適用於以下領域：
- **RAG 與企業搜尋**：透過結構化區塊進行語意分塊（Semantic Chunking），提升檢索準確度。
- **Agentic 程式開發**：提供結構化原始資料，讓 Agent 能執行表單填寫、發票處理及合規性檢查等任務。
- **資料管道**：透過置信度分數篩選需人工介入的資料，提升處理效率。

**取得方式與定價**
目前 Mistral OCR 4 已正式上線，開發者可透過 API 存取，或使用「Mistral AI Studio」中的 Document AI 功能進行無程式碼操作。
- **API 定價**：每 1,000 頁 4 美元，採用 Batch API 可享 50% 折扣（每 1,000 頁 2 美元）。
- **平台支援**：現已整合至 Amazon SageMaker 與 Microsoft Foundry，未來將支援 Snowflake Parse Document。
- **資源連結**：詳細技術指引可參考 [Mistral OCR 4 官方公告](https://mistral.ai/news/ocr-4) 以及官方提供的 `Getting Started with OCR 4 Cookbook`。

## 媒體內容

**Mistral OCR 4 在 OlmOcrBench 公開基準測試中以 85% 的準確率奪冠，並在 Crawl Multilingual 內部多語言評估中以 98% 的準確率領先其他競爭模型。**

**數據表（1）OlmOcrBench**

| 項目 | 數值 |
| --- | --- |
| Mistral OCR 4 | 85% |
| Chandra OCR 2 | 83% |
| Mineru Pro | 82% |
| PaddleOCR VL | 80% |
| GLM OCR | 79% |
| Deepseek OCR 2 | 77% |
| Gemini 3.1 Pro | 72% |
| GPT 5.5 | 71% |
| Azure | 56% |
| AWS Textract | 55% |

**數據表（2）Crawl Multilingual***

| 項目 | 數值 |
| --- | --- |
| Mistral OCR 4 | 98% |
| Chandra OCR 2 | 96% |
| Mineru Pro | 93% |
| PaddleOCR VL | 92% |
| GLM OCR | 82% |
| Deepseek OCR 2 | 89% |
| Azure | 88% |
| AWS Textract | 64% |

**根據盲測評估，Mistral OCR 4 在與各大競爭對手的對決中均取得顯著優勢，勝率介於 65.7% 至 82.3% 之間，全面領先所有測試系統。**

**數據表**

|   | Competitor | Mistral OCR 4 |
| --- | --- | --- |
| AWS Textract | 17.7% | 82.3% |
| Azure Doc Intel | 25.5% | 74.5% |
| Gemini 3.1 Pro Preview | 30.0% | 70.0% |
| GPT 5.5 Pro | 33.6% | 66.4% |
| Databricks | 34.3% | 65.7% |

## 標籤

新產品, 功能更新, RAG, Mistral AI