← 返回首頁

微軟發布三款 MAI 模型,以高效能與高性價比搶攻開發者市場

Satya Nadella
Satya Nadella
@satyanadella
991🔁 146
𝕏 (Twitter)🔥🔥🔥🔥🔥

AI 語音朗讀 · Edge TTS

AI 中文摘要Claude 生成

微軟發布三款 MAI 模型,以高效能與高性價比搶攻開發者市場。

微軟於 2026 年 4 月 2 日宣布推出三款全新的「MAI」系列模型,並同步開放於「Microsoft Foundry」與「MAI Playground」供開發者使用,強調在維持頂尖品質的同時,提供極具競爭力的價格與處理速度。

模型核心功能與效能
此次發布的三款模型分別針對語音轉錄、語音生成與圖像生成進行了優化:

  • 「MAI-Transcribe-1」:支援全球前 25 大常用語言,依據「FLEURS」基準測試,其在複雜環境下的語音轉錄品質極佳,批次處理速度為現有「Azure Fast」服務的 2.5 倍。
  • 「MAI-Voice-1」:專注於生成自然且具備情感表現力的語音,能保留說話者特徵,並支援僅需數秒音訊即可建立自定義語音,生成 60 秒音訊僅需 1 秒。
  • 「MAI-Image-2」:在「Arena.ai」排行榜名列前茅,經實測生成速度較前代提升至少 2 倍,特別強化了自然光影、膚色質感及圖像內文字的清晰度,適合專業視覺創作者使用。

商業應用與市場定位
微軟強調這些模型不僅用於內部產品,更致力於透過「Microsoft Foundry」將技術賦能給外部開發者,並明確標示了價格策略以展現競爭優勢:

  • 「MAI-Transcribe-1」:每小時 0.36 美元起。
  • 「MAI-Voice-1」:每 100 萬字元 22 美元起。
  • 「MAI-Image-2」:文字輸入每 100 萬 token 為 5 美元,圖像輸出每 100 萬 token 為 33 美元。
    行銷巨頭「WPP」已率先將「MAI-Image-2」導入大規模商業應用,並給予高度評價,認為其能精準回應創意需求。

設計理念與安全性
微軟將其 AI 開發理念定調為「Humanist AI」(人文主義人工智慧),強調以人為本、優化人類溝通方式及實務應用。在安全性方面,微軟聲稱這些模型皆經過嚴格的「紅隊測試」(red-teamed),並透過「Microsoft Foundry」提供內建的防護機制、治理規範與企業級控管,以確保開發者能安全且合規地進行大規模部署。