← 返回首頁
NVIDIA AI Developer
NVIDIA AI Developer
@NVIDIAAIDev
665🔁 88
𝕏 (Twitter)🔥🔥🔥🔥
AI 中文摘要Claude 生成
Nvidia推出Nemotron 3 Super,這是一款專為Agent應用設計的開源混合型大語言模型。該模型擁有1200億參數(其中120億為活躍參數),採用Mamba-Transformer混合架構搭配混合專家模組,具備原生百萬token的上下文窗口。 相比前一代,Nemotron 3 Super在吞吐量上提升5倍,準確度增長2倍。其潛在型混合專家機制能在相同運算成本下調用4倍的專家數量。多token預測功能則能大幅縮短長序列生成時間,實現內建推測解碼,在結構化生成任務上加速達3倍。 該模型採用混合Mamba-Transformer骨幹網絡,Mamba層提供線性時間複雜度處理長序列,Transformer注意力層負責精確檢索,混合專家層在保持低延遲的同時擴展有效參數量。原生NVFP4預訓練格式針對Nvidia Blackwell最佳化,相比FP8推論速度提升4倍,同時降低記憶體需求。 在PinchBench基準測試中,Nemotron 3 Super得分85.6%,成為同級最佳開源模型。模型完全開放,包含權重、資料集和訓練配方,使用者可在本地基礎設施上自訂部署。目前已在主流推論平台上線,並透過Hugging Face、Nvidia NIM、OpenRouter等多種方式取用。
Nvidia推出Nemotron 3 Super,這是一款專為Agent應用設計的開源混合型大語言模型。該模型擁有120... — VibeCoding — VibeCoding