# 策展 · X (Twitter) 🔥

> 作者：NVIDIA AI Developer (@NVIDIAAIDev) · 平台：X (Twitter) · 日期：2026-03-12

> 原始來源：https://x.com/nvidiaaidev/status/2031774913544016179?s=46&t=tLYlsHwrDsSqN-ldDSq50g

## 中文摘要

Nvidia推出Nemotron 3 Super，這是一款專為Agent應用設計的開源混合型大語言模型。該模型擁有1200億參數（其中120億為活躍參數），採用Mamba-Transformer混合架構搭配混合專家模組，具備原生百萬token的上下文窗口。

**效能提升**：相比前一代，Nemotron 3 Super在吞吐量上提升5倍，準確度增長2倍。其潛在型混合專家機制能在相同運算成本下調用4倍的專家數量。多token預測功能則能大幅縮短長序列生成時間，實現內建推測解碼。

**架構設計**採用混合Mamba-Transformer骨幹網絡，各層各司其職：
- Mamba層提供線性時間複雜度處理長序列
- Transformer注意力層負責精確檢索
- 混合專家層在保持低延遲的同時擴展有效參數量

原生NVFP4預訓練格式針對Nvidia Blackwell最佳化，相比FP8推論速度提升4倍，同時降低記憶需求。

**基準測試**：在PinchBench基準測試中，Nemotron 3 Super得分85.6%，成為同級最佳開源模型。模型完全開放，包含權重、資料集和訓練配方，使用者可在本地基礎設施上自訂部署。目前已在主流推論平台上線，以NVIDIA NIM形式提供，並可透過API、OpenRouter或nvidia.com取用。

## 標籤

LLM, Agent, 新產品, 開源專案, Nvidia