AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 1 篇
MoonshotAI開源FlashKDA,高性能Kimi Delta Attention核心實現,在H20上比flash-linear-attention基準快1.72×–2.22×。 MoonshotAI推出FlashKDA,這是基...