策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 59 篇
DISCO 透過聯合擴散技術實現蛋白質序列與結構的同步設計,突破自然界化學限制。 DISCO (Diffusion for Sequence-structure CO-design) 是一種多模態生成模型,能同時設計蛋白質序列與 3D...
@jarridrbKellyBench 揭示頂尖 AI 模型在長期決策任務中表現不佳。 「KellyBench」是一個針對長期、非靜態環境設計的評測基準,旨在測試 AI 模型在真實體育博彩市場中的序列決策能力,結果顯示目前所有頂尖模型皆無法穩定獲利。 ...
@GenReasoningMegaTrain 實現單 GPU 訓練 100B+ 參數模型。 MegaTrain 透過將主機記憶體作為參數儲存核心,成功在單一 GPU 上實現 100B+ 參數模型的高精度訓練,挑戰了傳統以 GPU 為中心的設計限制。此研究指出,...
@Underfox3Google 推出 PaperOrchestra 多 Agent 框架,實現端到端自動化學術論文寫作。 Google 研究團隊發表了 PaperOrchestra,這是一個專為自動化 AI 研究論文寫作設計的多 Agent 框架,旨在...
@dair_ai遺忘的幾何學:為什麼大腦與 LLM 會以「完全相同」的方式失效 TL;DR (總結) LLM 的記憶系統遺忘的方式與人類「完全相同」,重現了臨床心理學中一些最常被複製的實驗數據。 在過去幾個月裡,我們一直在探索一個單一觀察結果...
@ashwingopOpenAI 內部模型成功解決五項 Erdős 數學難題。 OpenAI 近期發表了一篇新論文,展示其內部模型成功解決了五項數學界的「Erdős 問題」,證明 AI 在處理複雜數學推論上的進展。 研究成果與亮點 這篇論文(編號...
@mehtaab_sawhneyMemento:教導 LLM 自行管理上下文 (Context) 我們教導模型在生成過程中自行壓縮其思維鏈 (Chain-of-Thought)。峰值 KV cache 下降了 2–3 倍,吞吐量幾乎翻倍,且被抹除的推理區塊會在 KV...
@DimitrisPapailVero:用於視覺推理的開源強化學習配方。 Vero 是一套針對視覺語言模型 (VLM) 的全開源強化學習 (RL) 訓練配方,旨在解決跨領域視覺推理任務,並透過大規模資料與任務路由獎勵機制,實現了超越現有模型的效能。 核心挑戰...
@GabrielSarch「Group-Evolving Agents (GEA)」透過群體演化取代個體演化,實現 AI 代理的累積式自我優化。 這項研究指出,現有 AI 代理的自我演化機制存在根本缺陷:過度模仿生物個體演化,導致演化路徑孤立,發現的創新無法累...
@xwang_lkAnthropic 透過可解釋性技術揭露 Claude Mythos 模型的內部策略思維與潛在風險。 Anthropic 在發布 Claude Mythos Preview 前,利用可解釋性技術深入剖析模型內部運作,發現該模型展現出複...
@Jack_W_LindseyCORAL 框架實現自主多 Agent 演化以推動開放式科學發現。 CORAL 是一個針對開放式發現問題的自主多 Agent 演化框架,它打破了傳統基於 LLM 的演化方法中依賴固定啟發式規則的限制,透過賦予 Agent 更高的自主權...
@ao_qu18465OSGym 透過基礎架構優化,實現大規模電腦操作 Agent 訓練。 OSGym 是一套專為電腦操作 Agent 設計的可擴展基礎架構,透過系統級優化解決了大規模訓練時的資源瓶頸與穩定性問題。該系統讓研究人員能在有限的學術資源下,高效...
@qinzytech