6月30日,美团正式发布LongCat-2.0——业界首个依靠国产算力完成训练、推理全流程的万亿参数大模型:1.6万亿参数(MoE,平均激活约480亿),支持1M Token超长上下文。4月Preview阶段已投入5-6万张国产加速卡完成万卡级预训练。 真正看点不在参数。架构沿用稀疏MoE思路,叠加N-gram Embedding扩展让高频模式直接命中;稀疏注意力配合跨层流感知索引,把百万上下文O(n²)开销压到可控。算子层针对昇腾910B自研FlashAttention反向梯度与GEMM,把硬件差异带来的性能损失压在5%以内——这才是国产万卡训练能跑起来的关键。 生态层面值得关注:Preview阶段LongCat-2.0在OpenRouter总调用量跻身全球前三,Hermes月调用量第一、Claude Code仅次于Claude Opus 4.8。国产模型在海外推理路由平台冲到头部,比刷Benchmark更有说服力。如果说DeepSeek V4证明"用什么卡"更灵活,LongCat-2.0则证明完全不用英伟达也能跑通万亿MoE——后者的工程外溢价值,可能比模型本身更大。