策展精選

AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。731

熱度
排序
𝕏🔥

Sendblue 推出命令列工具,讓 AI Agent 能直接使用 iMessage 號碼進行通訊,簡化部署流程。 核心功能 透過兩道簡單指令即可啟動服務: 透過 npm 全域安裝 @sendblue/cli 套件 執行 sendblue ...

Nikita@nikita_builds
2.1k🔁 118
𝕏🔥

Cohere 推出開源語音辨識模型「Cohere Transcribe」,在 HuggingFace 開源 ASR 排行榜上奪得首位,英文準確度達到 5.42% 的字誤率(WER),超越 Whisper Large v3、ElevenLab...

Cohere@cohere
2.6k🔁 297
𝕏🔥

Cline Kanban 是一款獨立應用程式,用於協調多個 CLI Agent,相容於 Claude 和 Codex。透過 npm i -g cline 即可全域安裝。該工具採用看板模式設計,讓使用者能以視覺化方式管理複雜的軟體開發工作流。...

Cline@cline
3.4k🔁 387
𝕏🔥

過去兩年中,推理類模型(如 OpenAI 的 o1 和 DeepSeek-R1)重塑了我們評估模型和期望的方式。2025 年上半年的重點仍聚焦於推理思考的優化,但下一波浪潮應是 Agent 思維:即模型在與環境互動的過程中進行思考與行動,並...

Junyang Lin@JustinLin610
𝕏🔥

Next.js 16.2 Adapter API 穩定發布,跨雲平台部署邁向開放協作新時代 Next.js 16.2 正式發布穩定的 Deployment Adapter API,由 Netlify、Cloudflare、OpenNext、...

Next.js@nextjs
2.0k🔁 327
𝕏🔥

我找到了在網路上保護 API keys 的完美方法 我最近將 BoltAI 移植到網路平台,並立即遇到一個技術挑戰:如何安全地儲存 API keys? 如果您不熟悉我的工作,BoltAI 是一個 BYOK (bring-your-own-k...

Daniel Nguyen@daniel_nguyenx
49🔁 3
𝕏🔥🔥

Meta 推出 TRIBE v2(三模態腦編碼器),一款基礎模型能預測人類大腦對幾乎任何視覺或聲音刺激的反應。相較於前代的 Algonauts 2025 獲獎架構,TRIBE v2 在訓練資料規模上有質的跳躍,從僅四個人的低解析度 fMRI...

AI at Meta@AIatMeta
16.0k🔁 2.5k
𝕏🔥

Mistral 推出 Voxtral TTS,一款輕量化的多語言文字轉語音模型,聲稱在零樣本語音適應測試中超越 ElevenLabs v2.5 Flash,同時維持低延遲性能,主要瞄準企業級語音代理應用。 核心功能與設計特點 Voxtral...

Mistral AI@MistralAI
4.6k🔁 619
𝕏🔥

Google DeepMind 團隊針對大型語言模型(LLM)存在的知識斷層問題發布了 Gemini API developer skill。LLM 在特定時間點進行訓練後知識就固定了,而軟體工程領域變化迅速——新程式庫每天都在推出,最佳實...

Philipp Schmid@_philschmid
381🔁 29
𝕏🔥

文件搜尋與回答(RAG)系統在處理 PDF 時面臨方法選擇問題,Weaviate 最新研究表明,文字提取、影像嵌入與混合方法各有優勢,沒有單一答案,而是需要視應用場景而定。 研究背景與核心問題 在構建 PDF RAG 管線時,開發者面臨兩條...

Victoria Slocum@victorialslocum
739🔁 100
𝕏🔥

使用 Gemini 3.1 Flash Live 建構即時對話式 Agent 今天,我們透過 Google AI Studio 中的 Gemini Live API 正式推出 Gemini 3.1 Flash Live。Gemini ...

Google AI Studio@GoogleAIStudio
2.4k🔁 344
𝕏🔥

Swarnim Jain 開發了 Grove,一個突破性的分散式機器學習訓練庫,讓 MacBook 無需任何設定就能自動發現彼此並協力訓練模型。核心創新在於利用 Apple 設備內建的 AWDL(Apple Wireless Direct ...

Swarnim Jain@swar_ja
3.3k🔁 266