在6月1日台北Computex 2026主题演讲中,英伟达CEO黄仁勋正式发布了Nemotron 3 Ultra——一款拥有约5500亿参数的开源大模型,一举成为美国开放权重模型中的智能新标杆。 Nemotron 3 Ultra采用90%稀疏性的MoE(专家混合)架构,实际激活参数约550亿。在Artificial Analysis的智能指数评测中,该模型取得48分,大幅领先Gemma 4 31B(39分)、Nemotron 3 Super(36分)以及gpt-oss-120b(33分),不过仍略低于中国主导的开源前沿模型Kimi K2.6(54分)。 性能方面,DeepInfra内测端点显示Nemotron 3 Ultra推理速度超过300 tokens/秒,而同量级的中国模型(DeepSeek、Moonshot等)通常在50-100 tokens/秒区间。速度优势来自NVFP4量化支持,这与此前Nemotron 3 Super的思路一脉相承。 值得关注的是,Nemotron 3 Ultra定位为「Agentic Coding & Search」场景,这意味着英伟达正将开源大模型从通用对话推向企业级自动化工作流。随着美国开放权重模型在智能和速度上同时逼近闭源前沿,2026年开源与闭源的差距将进一步收窄。