GLM-5.2 Day-0 落地 MTT S5000：国产算力适配开源旗舰的工程化样本

6 月 17 日，摩尔线程宣布在 AI 训推一体 GPU 智算卡 MTT S5000 上，完成对智谱新一代开源旗舰模型 GLM-5.2 的 Day-0 极速适配。距离上次 MTT S5000 完成 MiniMax M3 Day-0 适配仅四天——这意味着国产 GPU 厂商与国内头部开源模型团队之间，已经跑通了一条「模型发布即适配」的工程化流水线。这次适配延续了 GLM-5.1 长上下文 Prefill 与 P/D 异构分离推理的优化积累，重点针对 GLM-5.2 的超长上下文与复杂推理负载。GLM-5.2 把上下文推到百万级之后，长输入场景下的 Prefill 计算变得极为密集，能否在国产算力上保持高吞吐直接决定推理服务的可用性。摩尔线程把这套优化沉淀到了 S5000 的 MUSA 软件栈里——模型一发布，框架层面的算子、KV Cache 调度、并行策略就同步就绪。这件事的真正含义是「协同」模式的成型。过去国产 GPU 适配一个模型往往要等数周，开发者社区各自摸索；Day-0 适配的前提是软硬件联合调优进入常态，摩尔线程能提前拿到权重与算子定义，意味着模型团队也在为国产算力做友好性设计。这种相互前置的协作，比任何单独算力升级都更具信号意义。对中国 AI 推理市场来说，多一条 Day-0 路径就多一个采购可选项。下一步要看的是这种协同能否扩展到更多组合——一旦「发布即兼容」成为默认值，国产算力的渗透曲线才会真正加速。