策展精選

AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。768

熱度
排序
𝕏🔥🔥🔥

Microsoft將轉向GitHub Copilot token計費並收緊限制以削減成本。 Microsoft內部文件顯示,GitHub Copilot營運成本自今年1月起週比週幾乎翻倍,促使公司暫停個人及學生帳戶新註冊、移除低階訂閱...

Ed Zitron@edzitron
1.4k🔁 192
𝕏🔥🔥

蘋果執行長Tim Cook將於2026年9月1日卸任,由硬體工程資深副總裁John Ternus接任。 蘋果宣布,Tim Cook將辭去執行長一職,由John Ternus於2026年9月1日起接棒領導公司。 Cook的離任聲明...

Collin Rugg@CollinRugg
6.0k🔁 753
𝕏🔥🔥🔥🔥

Simon Willison升級「Claude Token Counter」工具,揭露Claude Opus 4.7 tokenizer變化導致token數暴增,實際成本大幅上漲。 Simon Willison於2026年4月20日發...

Simon Willison@simonw
1.6k🔁 143
𝕏🔥🔥

OpenMythos 推出開源「Claude Mythos」理論重構,使用 PyTorch 實現循環 Transformer 與 MoE 路由。 專案介紹 OpenMythos 是由 Kye Gomez 開發的開源專案,為 Anth...

Kye Gomez (swarms)@KyeGomezB
8.1k🔁 1.2k
𝕏🔥

Hermes Agent 實際應用以排程自動化為主,涵蓋商業研究、內容生成與代理監控。社群討論顯示,使用者偏好其檔案導向與推播輸出,學習迴圈讓工作流黏性強。 會前客戶研究 最高信號商業應用來自 r/hermesagent 討論串...

Matt Van Horn@mvanhorn
𝕏🔥

LLM推論快取全面指南:降低成本與延遲的關鍵策略。 大型語言模型(LLM)推論過程耗時且昂貴,主要因重複計算系統提示與常見查詢,推論快取透過儲存並重用計算結果,顯著降低token消耗與延遲,無需大幅修改應用邏輯。本文詳解三種主要快取類...

Machine Learning Mastery@TeachTheMachine
29🔁 3
𝕏🔥🔥

NVIDIA 超佛心福利!免費領取一年 API Key,MiniMax M2.7 / Kimi / DeepSeek 全都能用,一毛錢都不用花! 用一句話總結這個福利: NVIDIA 投入真金白銀的 H100 算力,讓你免費使用...

XDmnnn不淡@XDmnnn0616
2.7k🔁 568
𝕏🔥🔥

一文理清!Hermes 全部高階工具配置 Hermes 出來後發現並沒有太多人遷移過來,這次不像之前 OpenClaw 發布的時候,大家都在等,等更好的 Agent,等更好的模型。其實實際操作起來,後面即使出現更好的 Agent 也是...

Researcher_王十三@ResearchWang
1.0k🔁 207
𝕏🔥

HermesOS公開路圖,打造無基礎設施AI Agent託管平台。 HermesOS是受管理的AI Agent託管平台,讓使用者在5分鐘內部署持久自主Agent,無需Docker、VPS或配置檔案。平台基於Nous Research的...

Ash@Wayland_Six
1.0k🔁 78
𝕏🔥

KohakuTerrarium 1.0.0 發布,提供通用 Agent 框架,避免重複重建底層架構。 KohakuTerrarium 是專為建構 Agent 而設計的框架,而非另一個 Agent 產品,它解決 LLM/Agent 領域...

琥珀青葉@KohakuLab@KBlueleaf
53🔁 16
𝕏🔥

克服 TRL 中訓練器與生成器之間的精度不匹配問題 數值精度差異導致的「幻影 PPO 裁剪」阻礙了 RL 收斂。 簡短總結:我們發現當訓練的前向傳遞(FP32)與 vLLM 推論伺服器(BF16)使用不同的數值精度時,非同步 G...

Dirhousssi Amine@DirhousssiAmine
73🔁 7
𝕏🔥

LiteParse快速竄紅並正式加入LlamaIndex生態。 「LiteParse」僅數週內GitHub星數突破4.3K,現正式融入LlamaIndex生態,並擁有專屬頁面(http://www.llamaindex.ai/lite...

LlamaIndex 🦙@llama_index
163🔁 18