策展精選

AI 技術社群精選內容，按時間排序瀏覽所有策展貼文。共 59 篇

研究論文

熱度

排序

𝕏🔥2026/4/9

DISCO 透過聯合擴散技術實現蛋白質序列與結構的同步設計，突破自然界化學限制。 DISCO (Diffusion for Sequence-structure CO-design) 是一種多模態生成模型，能同時設計蛋白質序列與 3D...

AIGC 研究論文其他 DISCO

@jarridrb

♥1.0k🔁 244

𝕏🔥2026/4/9

KellyBench 揭示頂尖 AI 模型在長期決策任務中表現不佳。「KellyBench」是一個針對長期、非靜態環境設計的評測基準，旨在測試 AI 模型在真實體育博彩市場中的序列決策能力，結果顯示目前所有頂尖模型皆無法穩定獲利。 ...

Benchmark 研究論文 LLM KellyBench

@GenReasoning

♥627🔁 49

𝕏🔥2026/4/9

MegaTrain 實現單 GPU 訓練 100B+ 參數模型。 MegaTrain 透過將主機記憶體作為參數儲存核心，成功在單一 GPU 上實現 100B+ 參數模型的高精度訓練，挑戰了傳統以 GPU 為中心的設計限制。此研究指出，...

研究論文 LLM MegaTrain

@Underfox3

♥174🔁 25

𝕏🔥2026/4/9

Google 推出 PaperOrchestra 多 Agent 框架，實現端到端自動化學術論文寫作。 Google 研究團隊發表了 PaperOrchestra，這是一個專為自動化 AI 研究論文寫作設計的多 Agent 框架，旨在...

Agent 新產品研究論文 Google

@dair_ai

♥453🔁 79

𝕏🔥2026/4/9

遺忘的幾何學：為什麼大腦與 LLM 會以「完全相同」的方式失效 TL;DR (總結) LLM 的記憶系統遺忘的方式與人類「完全相同」，重現了臨床心理學中一些最常被複製的實驗數據。在過去幾個月裡，我們一直在探索一個單一觀察結果...

LLM 研究論文 Embedding LLM

@ashwingop

♥661🔁 86

𝕏🔥2026/4/9

OpenAI 內部模型成功解決五項 Erdős 數學難題。 OpenAI 近期發表了一篇新論文，展示其內部模型成功解決了五項數學界的「Erdős 問題」，證明 AI 在處理複雜數學推論上的進展。研究成果與亮點這篇論文（編號...

研究論文 LLM AIGC OpenAI GPT

@mehtaab_sawhney

♥893🔁 151

𝕏🔥2026/4/9

Memento：教導 LLM 自行管理上下文 (Context) 我們教導模型在生成過程中自行壓縮其思維鏈 (Chain-of-Thought)。峰值 KV cache 下降了 2–3 倍，吞吐量幾乎翻倍，且被抹除的推理區塊會在 KV...

LLM 研究論文開源專案 Memento

@DimitrisPapail

♥886🔁 134

𝕏🔥2026/4/8

Vero：用於視覺推理的開源強化學習配方。 Vero 是一套針對視覺語言模型 (VLM) 的全開源強化學習 (RL) 訓練配方，旨在解決跨領域視覺推理任務，並透過大規模資料與任務路由獎勵機制，實現了超越現有模型的效能。核心挑戰...

VLM 開源專案研究論文 Vero

@GabrielSarch

♥290🔁 58

𝕏🔥2026/4/8

「Group-Evolving Agents (GEA)」透過群體演化取代個體演化，實現 AI 代理的累積式自我優化。這項研究指出，現有 AI 代理的自我演化機制存在根本缺陷：過度模仿生物個體演化，導致演化路徑孤立，發現的創新無法累...

Agent 研究論文 AI Agent

@xwang_lk

♥503🔁 111

𝕏🔥2026/4/8

Anthropic 透過可解釋性技術揭露 Claude Mythos 模型的內部策略思維與潛在風險。 Anthropic 在發布 Claude Mythos Preview 前，利用可解釋性技術深入剖析模型內部運作，發現該模型展現出複...

研究論文 LLM 資安 Anthropic Claude

@Jack_W_Lindsey

♥6.8k🔁 772

𝕏🔥2026/4/7

CORAL 框架實現自主多 Agent 演化以推動開放式科學發現。 CORAL 是一個針對開放式發現問題的自主多 Agent 演化框架，它打破了傳統基於 LLM 的演化方法中依賴固定啟發式規則的限制，透過賦予 Agent 更高的自主權...

Agent 研究論文開源專案 CORAL

@ao_qu18465

♥455🔁 75

𝕏🔥2026/4/7

OSGym 透過基礎架構優化，實現大規模電腦操作 Agent 訓練。 OSGym 是一套專為電腦操作 Agent 設計的可擴展基礎架構，透過系統級優化解決了大規模訓練時的資源瓶頸與穩定性問題。該系統讓研究人員能在有限的學術資源下，高效...

Agent 開源專案研究論文 OSGym

@qinzytech

♥493🔁 146