← 返回首頁

webAI 發布 YOLO26-MLX,實現 Apple Silicon 原生高效能電腦視覺

webAI
webAI
@thewebAI
372🔁 40
𝕏 (Twitter)🔥🔥
AI 中文摘要Claude 生成

webAI 發布 YOLO26-MLX,實現 Apple Silicon 原生高效能電腦視覺。

webAI 開源了 YOLO26-MLX,這是一套專為 Apple Silicon 設計的 YOLO26 原生實作,無需 PyTorch 執行環境即可在 Mac 上進行高效能的訓練與推論。此舉旨在打破以往電腦視覺模型必須依賴 Linux 與重型機器學習框架的限制,讓開發者能直接在 Mac 硬體上進行模型開發與部署。

效能與架構優勢
YOLO26-MLX 徹底擺脫了對 PyTorch 執行環境的依賴,直接利用 Apple 的 MLX 框架進行開發,實現了與 Apple Silicon 的深度整合。

  • 效能顯著提升:在 Apple M4 Pro 的內部基準測試中,推論速度提升達 1.1 至 2.6 倍,訓練速度提升約 1.7 倍。
  • 架構設計:採用 End to End (端到端) 的偵測模型,移除了傳統的非極大值抑制 (NMS) 步驟,簡化了部署流程並降低了延遲。
  • 資源利用:透過 MLX 的統一記憶體架構,開發者能更有效地利用 CPU 與 GPU 資源,實現高效的本地端模型運作。

精準度與功能完整性
儘管追求效能,該實作在精準度上並未妥協,在 COCO val2017 資料集上的驗證結果顯示,其 mAP 與官方 YOLO26 模型差距在 0.2% 以內,最大偏差僅 0.5%。

  • 功能全面:專案不僅包含完整的訓練與推論管線,還整合了基準測試、驗證工具,以及將現有 YOLO 權重轉換為 MLX 格式的工具。
  • 新增多物件追蹤:支援 ByteTrack 與 BoT-SORT 追蹤器,並具備純 MLX 實作的卡爾曼濾波器,適合需要即時追蹤的應用場景。
  • 彈性配置:支援完整的 YOLO26 模型家族,從適合嵌入式裝置的輕量化模型 (n, s) 到高精準度的大型架構 (m, l, x) 皆可使用。

開發者體驗與應用場景
此專案降低了邊緣 AI 開發的門檻,讓開發者能直接在 Mac 上進行模型迭代,無需轉向 Linux 或依賴外部 GPU 基礎設施。

  • 簡化部署:開發者只需透過簡單的步驟,即可完成模型下載、轉換與執行,大幅縮短從模型到生產環境的週期。
  • 實作透明:該專案為 YOLO26 的原生 MLX 實作,而非僅是現有框架的封裝,這使得開發者能更深入地理解並優化模型在 Apple 硬體上的表現。
  • 應用廣泛:無論是進行即時物件偵測、多物件追蹤,還是針對特定領域進行模型微調,YOLO26-MLX 都提供了一套完整的解決方案。