策展精選

AI 技術社群精選內容，按時間排序瀏覽所有策展貼文。共 59 篇

研究論文

熱度

排序

𝕏🔥2026/4/15

DDTree透過單次區塊擴散前向傳遞建構草稿樹，提升推測解碼加速比。 DDTree（Diffusion Draft Tree）是一種新型推測解碼方法，從單次區塊擴散前向傳遞產生每個位置的token分佈，直接建構草稿樹，並以樹狀注意力在...

研究論文 LLM Benchmark DDTree

@liranringel

♥980🔁 132

𝕏🔥2026/4/14

R-Zero實現零外部資料自進化LLM推理能力大幅躍升。「R-Zero」是ICLR 2026論文提出的全自主框架，從單一基礎LLM出發，透過「Challenger」與「Solver」兩個角色互動共進化，生成自身訓練資料並克服人類資料...

LLM 研究論文 Benchmark R-Zero Qwen

@Han_Fang_

♥430🔁 64

𝕏🔥2026/4/13

Autoreason 透過三方競賽機制解決 LLM 自我修正失效問題。 Autoreason 是一種受 AutoResearch 啟發的推理方法，旨在解決大型語言模型 (LLM) 在迭代自我修正過程中常見的效能退化問題。該方法透過結構...

LLM 研究論文 Autoreason

@SHL0MS

♥1.4k🔁 156

𝕏🔥2026/4/11

研究顯示平行採樣在大型推理模型中優於序列採樣。 Google DeepMind 的研究指出，在大型推理模型 (LRMs) 進行數學與程式撰寫任務時，平行採樣的表現通常優於序列採樣，且關鍵原因在於序列採樣缺乏足夠的探索性。研究背...

研究論文 LLM Benchmark Google DeepMind Gemini

@gu_xiangming

♥167🔁 24

𝕏🔥2026/4/11

中文書法是一項前沿任務前沿模型（Frontier models）能夠掌握中文書法的藝術嗎？我們向它們發起挑戰，要求它們重現 20 位書法大師所寫的 88 個高難度漢字。動機：受限的美學操縱前沿模型在工具使用、數學和程...

研究論文 AIGC VLM Frontier Models

@leonardtang_

♥60🔁 8

𝕏🔥2026/4/11

EvoSkill 透過自動化演算法提升程式開發 Agent 的效能。 EvoSkill 是一個與 Agent 無關的工具組，旨在透過自動化發現與優化技能，顯著增強程式撰寫 Agent 的能力，並已獲得學術論文引用。該工具透過自我演化機...

Skills Agent 研究論文開源專案 EvoSkill DSPy

@Anitahityou

♥104🔁 13

𝕏🔥2026/4/11

Why Is Continual Learning Even Possible Mathematically? 為什麼持續學習在數學上是可能的？ To answer this question, we need to step bac...

研究論文其他

@BetaTomorrow

♥710🔁 80

𝕏🔥2026/4/10

Latent Briefing：透過 KV Cache Compaction 實現多 Agent 系統的高效記憶共享多 Agent 系統在協調、複雜推理與平行工作流方面展現了極大的潛力。然而，它們往往存在嚴重的 token 使用效率...

Agent 研究論文 LLM Multi-Agent

@RampLabs

♥1.4k🔁 139

𝕏🔥2026/4/10

「管理不善的天才」假說 (The "Mismanaged Geniuses" Hypothesis) tldr; AI 模型已經具備實現下一次能力飛躍的條件。作者：Alex Zhang (@a1zhang), Zhening ...

研究論文產業趨勢 LLM AI Research

@a1zhang

♥1.1k🔁 133

𝕏🔥2026/4/10

「Memory Intelligence Agent (MIA)」透過 Manager-Planner-Executor 架構，讓 AI 從被動紀錄轉向主動策略演進。「Memory Intelligence Agent (MIA)」...

Agent 研究論文開源專案華東師範大學上海智慧研究院 MIA

@TheTuringPost

♥124🔁 28

𝕏🔥2026/4/10

「HyperMem」透過超圖架構優化長期記憶，在 LoCoMo 基準測試中達到 92.73% 的準確率。 EverMind 團隊發表的最新論文「HyperMem: Hypergraph Memory for Long-Term Con...

研究論文 RAG Benchmark EverMind ACL

@evermind

♥53🔁 6

𝕏🔥2026/4/10

當前主流 AI Agent 評測基準存在嚴重漏洞，研究顯示透過簡單的攻擊手法即可在不解決任何任務的情況下獲得滿分。研究人員針對八大主流 AI Agent 評測基準進行審計，發現所有基準皆存在可被利用的漏洞，導致模型在未解決任何任務的...

Agent Benchmark 研究論文產業趨勢 AI Agent

@MogicianTony

♥667🔁 90