6 月 17 日,摩尔线程宣布在 AI 训推一体 GPU 智算卡 MTT S5000 上,完成对智谱新一代开源旗舰模型 GLM-5.2 的 Day-0 极速适配。距离上次 MTT S5000 完成 MiniMax M3 Day-0 适配仅四天——这意味着国产 GPU 厂商与国内头部开源模型团队之间,已经跑通了一条「模型发布即适配」的工程化流水线。 这次适配延续了 GLM-5.1 长上下文 Prefill 与 P/D 异构分离推理的优化积累,重点针对 GLM-5.2 的超长上下文与复杂推理负载。GLM-5.2 把上下文推到百万级之后,长输入场景下的 Prefill 计算变得极为密集,能否在国产算力上保持高吞吐直接决定推理服务的可用性。摩尔线程把这套优化沉淀到了 S5000 的 MUSA 软件栈里——模型一发布,框架层面的算子、KV Cache 调度、并行策略就同步就绪。 这件事的真正含义是「协同」模式的成型。过去国产 GPU 适配一个模型往往要等数周,开发者社区各自摸索;Day-0 适配的前提是软硬件联合调优进入常态,摩尔线程能提前拿到权重与算子定义,意味着模型团队也在为国产算力做友好性设计。这种相互前置的协作,比任何单独算力升级都更具信号意义。 对中国 AI 推理市场来说,多一条 Day-0 路径就多一个采购可选项。下一步要看的是这种协同能否扩展到更多组合——一旦「发布即兼容」成为默认值,国产算力的渗透曲线才会真正加速。