美团LongCat-2.0：万亿MoE的"去英伟达"工程拐点

6月30日，美团正式发布LongCat-2.0——业界首个依靠国产算力完成训练、推理全流程的万亿参数大模型：1.6万亿参数（MoE，平均激活约480亿），支持1M Token超长上下文。4月Preview阶段已投入5-6万张国产加速卡完成万卡级预训练。真正看点不在参数。架构沿用稀疏MoE思路，叠加N-gram Embedding扩展让高频模式直接命中；稀疏注意力配合跨层流感知索引，把百万上下文O(n²)开销压到可控。算子层针对昇腾910B自研FlashAttention反向梯度与GEMM，把硬件差异带来的性能损失压在5%以内——这才是国产万卡训练能跑起来的关键。生态层面值得关注：Preview阶段LongCat-2.0在OpenRouter总调用量跻身全球前三，Hermes月调用量第一、Claude Code仅次于Claude Opus 4.8。国产模型在海外推理路由平台冲到头部，比刷Benchmark更有说服力。如果说DeepSeek V4证明"用什么卡"更灵活，LongCat-2.0则证明完全不用英伟达也能跑通万亿MoE——后者的工程外溢价值，可能比模型本身更大。