GLM-5.2 把国产大模型的战线,又往前推了一截。 6月15日,智谱正式开源新一代旗舰 GLM-5.2,把"长程任务"做成了产品主轴——模型不再只回答"今天天气怎么样",而是面向数小时甚至整夜的连续工程任务,要能自己跑完一个完整项目。在 Code Arena 这套百万用户参与的前端盲测榜单上,GLM-5.2 已经坐到全球可用模型第一位。 进度让海外同行开始重新评估。当网友在 X 抛出"中国大模型何时能追上 Claude Fable"时,马斯克给出的答案是"可能在 2027 年一季度"。这句话相当克制——Fable 是 Anthropic 目前明确受限未公开的旗舰级能力线,对外放出的 Fable 5 也只是 Mythos 级能力的"窄入口"。 中国 AI 圈普遍认为这个时间表偏保守。业内人士据此判断,中美顶级模型的差距可能不到 7 个月。谷歌 DeepMind 哈萨比斯的判断更激进,他此前表示中国模型能力上"只差几个月"就能赶上海外——DeepMind 刚经历了诺奖级科学家 John Jumper 被 Anthropic 挖角,对人才与研究节奏的评估应该不会过度乐观。 把马斯克、哈萨比斯和中国从业者三方观点摆一起看,会发现一个隐藏共识:没有人再怀疑中国会追上,分歧只在具体季度数。这和 2024 年那轮"中国会不会卡在 GPT-4 水平"的悲观论调,是根本性的不同。 决定 2027 还是 2026 年底的,是三件事:长上下文与 Agent 框架能否继续往工程深处推进、合规与安全审查是否再来一次收紧、开源生态能否把模型易用性再做一档提升。前两项已经在发生,第三项正是 GLM-5.2 这种"功能优先"开源旗舰最有可能撬动的杠杆。