← 返回首頁
Sanchit monga
Sanchit monga
@sanchitmonga22
126🔁 18
𝕏 (Twitter)🔥
AI 中文摘要Claude 生成
RunAnywhere 推出的 RCLI 是一套完整的本地AI語音解決方案,在 macOS 上運行,聲稱為語音 AI 的未來。該專案採用端到端的語音加檢索增強生成(RAG)流程,聲稱延遲約 131 毫秒,主要特色是完全本地化、開源免費,並承諾使用者資料永久隱私保護。 RCLI 採用語音轉文字、大型語言模型與文字轉語音的完整 pipeline,在 Apple Silicon 的 Metal GPU 上原生運行。系統支援 38 個 macOS 動作,可透過聲音或文字控制,包括生產力工具、通訊、媒體播放、系統設定及網頁搜尋等功能。軟體無需雲端服務或 API 金鑰,所有運算都在裝置上完成。 核心優勢在於 MetalRT,這是 RunAnywhere 開發的專有 GPU 推論引擎,針對 Apple Silicon 最佳化。根據基準測試,MetalRT 的解碼速度比 llama.cpp 和 Apple MLX 更快。聲音活動偵測使用 Silero,語音轉文字支援 Zipformer 流式與 Whisper 或 Parakeet 離線模式,大型語言模型支援 Qwen3、LFM2 等,文字轉語音則提供多款選擇,包括 Kokoro 提供 28 種聲音。 RAG 功能允許使用者索引本地文件,透過語音提問,使用混合向量與 BM25 檢索方式,延遲約 4 毫秒,支援 PDF、DOCX 及純文本格式。安裝則相當簡化,透過單一指令或 Homebrew 即可完成,首次設定需下載約 1GB 的預設模型。 然而硬體要求相當明確:MetalRT 引擎需要 M3 或更新的 Apple Silicon 晶片。M1 與 M2 Mac 會自動回退到開源的 llama.cpp 引擎,這限制了適用範圍。軟體提供互動式終端介面,支援推放式通話、即時硬體監控、模型管理及動作瀏覽器功能。 安裝相當直接,可透過 curl 指令或 Homebrew 進行。軟體本身採 MIT 授權開源,但 MetalRT 引擎採專有授權,由 RunAnywhere 公司所有。文件強調這是實時螢幕錄製展示,未經編輯或 cloud 處理,試圖驗證其本地運行的聲稱。專案允許社群貢獻,支援新增動作、模型或聲音。整體而言,RCLI 針對希望完全本地化、隱私優先的語音 AI 使用者,提供了具體的技術方案,雖然硬體要求與 MetalRT 的專有性質可能限制其採用範圍。
RunAnywhere 推出的 RCLI 是一套完整的本地AI語音解決方案,在 macOS 上運行,聲稱為語音 AI 的... — VibeCoding — VibeCoding