# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Satya Nadella (@satyanadella) · 平台：X (Twitter) · 日期：2026-04-02

> 原始來源：https://x.com/satyanadella/status/2039711802259542302

## 中文摘要

微軟發布三款 MAI 模型，以高效能與高性價比搶攻開發者市場。

微軟於 2026 年 4 月 2 日宣布推出三款全新的「MAI」系列模型，並同步開放於「Microsoft Foundry」與「MAI Playground」供開發者使用，強調在維持頂尖品質的同時，提供極具競爭力的價格與處理速度。

**模型核心功能與效能**
此次發布的三款模型分別針對語音轉錄、語音生成與圖像生成進行了優化：
- 「MAI-Transcribe-1」：支援全球前 25 大常用語言，依據「FLEURS」基準測試，其在複雜環境下的語音轉錄品質極佳，批次處理速度為現有「Azure Fast」服務的 2.5 倍。
- 「MAI-Voice-1」：專注於生成自然且具備情感表現力的語音，能保留說話者特徵，並支援僅需數秒音訊即可建立自定義語音，生成 60 秒音訊僅需 1 秒。
- 「MAI-Image-2」：在「Arena.ai」排行榜名列前茅，經實測生成速度較前代提升至少 2 倍，特別強化了自然光影、膚色質感及圖像內文字的清晰度，適合專業視覺創作者使用。

**商業應用與市場定位**
微軟強調這些模型不僅用於內部產品，更致力於透過「Microsoft Foundry」將技術賦能給外部開發者，並明確標示了價格策略以展現競爭優勢：
- 「MAI-Transcribe-1」：每小時 0.36 美元起。
- 「MAI-Voice-1」：每 100 萬字元 22 美元起。
- 「MAI-Image-2」：文字輸入每 100 萬 token 為 5 美元，圖像輸出每 100 萬 token 為 33 美元。
行銷巨頭「WPP」已率先將「MAI-Image-2」導入大規模商業應用，並給予高度評價，認為其能精準回應創意需求。

**設計理念與安全性**
微軟將其 AI 開發理念定調為「Humanist AI」（人文主義人工智慧），強調以人為本、優化人類溝通方式及實務應用。在安全性方面，微軟聲稱這些模型皆經過嚴格的「紅隊測試」（red-teamed），並透過「Microsoft Foundry」提供內建的防護機制、治理規範與企業級控管，以確保開發者能安全且合規地進行大規模部署。

## 標籤

新產品, AIGC, TTS, 開源專案, VLM, LLM, Microsoft