智元罗剑岚:把「部署-数据-迭代」打成飞轮,比堆参数更像具身智能的 Scaling Law

36氪硬氪对智元机器人首席科学家罗剑岚做了一次长访。这位伯克利出身、曾在 Google X 与 DeepMind 任研究科学家的学者给出不"应景"判断:国内具身智能行业里真正做基础模型预训练的团队极少,多数所谓"基础模型"更接近中训练或微调;具身智能不能盲目对标 GPT 式 Scaling Law,离线 Loss 下降并不必然对应真实部署成功率提升。 **真正的决胜点不是单点能力** 罗剑岚把具身智能瓶颈归为"木桶效应"——数据、模型、Infra 哪一环过短,体系都跑不动。他的工作支点不是堆参数,而是三个工程抓手:SOP(在线后训练,让部署数据回流到训练闭环)、LWD(部署中学习)、以及 τ0-WM 世界模型。 **τ0-WM:把"想象未来"做成决策的一部分** 和业内把世界模型当视频生成器不同,τ0-WM 定位为动作条件物理推演器——给定当前观测和候选动作,预测把世界带到什么状态。它把 VAM 与动作条件视频模拟器组合,在测试时通过 RCS 评分 + LAR 模拟器修正,让机器人执行动作前先在内部"沙盘推演",裸策略成功率从 43% 拉到 60%。 **评论** 罗剑岚的真正观点是:具身智能跑不出 LLM 的"暴力出奇迹",下一步决胜在谁能率先在半结构化场景中跑通"部署—数据—迭代"飞轮。12-18 个月内出现第一个真实闭环信号,资本与产业资源就会向这个方向集中——这既是他给智元机器人的路径定义,也是给整个具身赛道敲响的工程化警钟。