图灵奖得主萨顿牵手他山科技：机器人训练进入「经验时代」

2024年图灵奖得主、强化学习奠基人理查德·萨顿在2025年提出欢迎来到经验时代的论断：新一代智能体必须拥有像人类一样在长时间尺度上不断推进的经验流，在真实物理反馈中实现自我进化。这一判断正在加速落地。所谓经验，指的是智能体在物理世界中通过触觉、试错、反馈形成的直接感知。传统模仿学习依赖人类演示，本质上是第二人称经验，机器人只能模仿人的做法，却无法亲手摸出物理规律。要真正理解世界，机器人需要自己的第一人称经验。他山科技掌握的高精度触觉感知技术，力分辨率0.01N，达一根头发丝的触感精度，填补了这个空白。2026年5月，萨顿正式与他山科技签约，共同推进机器人幼儿园项目——一个融合真实物理环境、仿真平台、触觉传感与强化学习的持续学习训练基地。这个项目的核心逻辑很清晰：人类正确示范很模糊，但错误有清晰边界。足够的试错才能让机器人划出任务边界，理解何时该收紧、何时该放松。商业上，这套方法已在小龙虾去头这样的精细操作场景中达到95%以上成功率。萨顿与合作方计划用五年周期，探索具身智能持续学习的方法论。这不仅是商业应用，更是大模型从语言认知向物理具身跨越的基础设施建设。经验时代正在从论文走向机器人实训场。