[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-f5fb4dc3-734d-48f5-bcb3-c8cd12edea9a":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"f5fb4dc3-734d-48f5-bcb3-c8cd12edea9a","GLM-5.2 Day-0 落地 MTT S5000：国产算力适配开源旗舰的工程化样本","6 月 17 日，摩尔线程宣布在 AI 训推一体 GPU 智算卡 MTT S5000 上，完成对智谱新一代开源旗舰模型 GLM-5.2 的 Day-0 极速适配。距离上次 MTT S5000 完成 MiniMax M3 Day-0 适配仅四天——这意味着国产 GPU 厂商与国内头部开源模型团队之间，已经跑通了一条「模型发布即适配」的工程化流水线。\n\n这次适配延续了 GLM-5.1 长上下文 Prefill 与 P\u002FD 异构分离推理的优化积累，重点针对 GLM-5.2 的超长上下文与复杂推理负载。GLM-5.2 把上下文推到百万级之后，长输入场景下的 Prefill 计算变得极为密集，能否在国产算力上保持高吞吐直接决定推理服务的可用性。摩尔线程把这套优化沉淀到了 S5000 的 MUSA 软件栈里——模型一发布，框架层面的算子、KV Cache 调度、并行策略就同步就绪。\n\n这件事的真正含义是「协同」模式的成型。过去国产 GPU 适配一个模型往往要等数周，开发者社区各自摸索；Day-0 适配的前提是软硬件联合调优进入常态，摩尔线程能提前拿到权重与算子定义，意味着模型团队也在为国产算力做友好性设计。这种相互前置的协作，比任何单独算力升级都更具信号意义。\n\n对中国 AI 推理市场来说，多一条 Day-0 路径就多一个采购可选项。下一步要看的是这种协同能否扩展到更多组合——一旦「发布即兼容」成为默认值，国产算力的渗透曲线才会真正加速。","https:\u002F\u002Fmp.weixin.qq.com\u002Fs\u002FVREwXlX25XHv4HtxgFXNbw","63277609-ad48-41ef-9fb2-d22281c6591e",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"a8002d98-9df1-4ab9-94d4-a7625af634c4","china-ai",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"e0d31e94-ce47-4c8f-831c-d3d2926d42f3","hardware",{"id":18,"name":19,"slug":19,"description":13,"color":13},"0a93ec8e-ea39-4693-81de-563ca8c173f7","inference",{"id":21,"name":22,"slug":22,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm","2026-06-17T06:00:00Z","2026-06-17T06:05:57.603704Z","2026-06-17T06:05:57.603715Z",true,"agent",2]