# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Fish Audio (@FishAudio) · 平台：X (Twitter) · 日期：2026-07-02

> 原始來源：https://x.com/FishAudio/status/2072319320386883690

## 中文摘要

Fish Audio 開放 S2.1 Pro 語音模型供開發者免費使用，並透過 API 提供 83 種語言支援與無硬性用量限制的服務。

**免費開放策略**
Fish Audio 宣布其頂尖的語音模型「S2.1 Pro」正式對開發者免費開放。此模型與付費層級使用的 TTS（文字轉語音）技術完全相同，且不設硬性使用上限。開發者若已整合 Fish Audio 的 API，僅需將模型參數設定為 `s2.1-pro-free`，即可直接啟用此版本。該模型支援 83 種語言；據 Fish Audio 官方宣稱，其首音延遲（TTFA）低至 90 毫秒，可帶來更流暢的即時對話體驗。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1782970497723-zzezcwen.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/74b194e1f8f67deb.jpg" controls playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> Fish Audio 推出 S2.1 Pro 語音模型，強調 90 毫秒的超低延遲與即時對話能力。

**平台功能概覽**
根據官方文件（[Fish Audio Capabilities](https://docs.fish.audio/overview/capabilities)），Fish Audio 是一個綜合性的語音 AI 平台，提供多種開發與應用路徑：
- **核心功能**：包含文字轉語音（TTS）、語音轉文字（STT）、語音複製（Voice Cloning）以及適用於語音 Agent 的即時串流（Realtime Streaming）。
- **開發者工具**：除了 REST API 與 SDK 外，平台亦提供專屬的 `skill` 供 AI 程式開發 Agent 使用，協助開發者更精確地撰寫整合程式碼。
- **網頁應用**：針對無程式撰寫需求的使用者，平台提供「Story Studio」用於長篇音訊製作、「Audio Separation」進行音訊分離，以及音樂與音效生成工具。

**模型選擇與整合**
目前 Fish Audio 提供多款模型供選擇，開發者可根據需求調整：
- `s2.1-pro`：推薦用於生產環境，具備最佳的品質與輸送量。
- `s2.1-pro-free`：專為測試、原型開發及小型企業設計，免費提供但無 TTFA（Time to First Audio）或 DPA（資料處理協定）保證。
- `s2-pro` 與 `s1`：為舊世代模型，保留特定情感標籤與多說話者控制功能。

開發者可參閱官方的 `Models Overview`（`/developer-guide/models-pricing/models-overview`）與 `Choosing a Model`（`/developer-guide/models-pricing/choosing-a-model`）文件，以獲取完整的語言支援清單與詳細限制說明。

## 媒體內容

**Fish Audio 推出 S2.1 Pro 語音模型，強調 90 毫秒的超低延遲與即時對話能力。**

**影片中的 Prompt 與操作**

Prompt（00:16）：

```
請給我一個快速的巧克力蛋糕食譜。
```

原文：Give me a quick recipe for chocolate cake.

操作步驟：

1. （00:16）輸入指令詢問巧克力蛋糕食譜
2. （00:19）系統顯示思考中（Thinking... 250ms）並開始生成語音回應

## 標籤

TTS, 新產品, 功能更新, Fish Audio