4B 参数横扫四大具身基准:开悟世界模型让小模型重新定义 SOTA

大晓机器人(商汤系)旗下开悟世界模型(Kairos)最近同时在 RoboTwin 2.0、LIBERO-Plus、WorldModelBench Robot、DreamGen 四项全球权威具身智能评测中拿下第一,把 Cosmos 2.5-14B、Wan 2.2-5B、Lingbot 等百亿俱乐部选手压在身后。考虑到它只有 4B 参数、23.5GB 显存占用,这不仅是跑分赢,更像是在质疑大参数=高性能的行业惯性。技术差异在架构层面。开悟 3.0 走多模态理解—生成—预测原生一体路线,把物理因果链和思维链直接编进决策过程,而不是像多数同行那样在视频扩散模型外挂运动接口。其自研的混合时间线性注意力算子是真正放量点——A800 上 10 秒生成任务仅耗时 9.5 秒,对比 Cosmos 2.5 的 687.2 秒提速 72 倍,云侧 1:1 实时推理也因此首次成为可能。更值得关注的是端侧落地。它是行业首个在 Jetson Thor T5000 平台跑出 1:1.5(生成时间:视频时长)实时生成的具身世界模型,意味着机器人本体可以想到即可做到,省掉中间转译环节。一脑多形泛化也跑通了——同一权重可同时驱动单臂、双臂、灵巧手,覆盖智元 G1、松灵 PIPER、宇树 G1 等不同硬件。当视频生成赛道还在拼更长的上下文、更大的窗口时,开悟选了一条反方向的路:用 4B 模型、几 GB 显存、端侧实时,去撬动具身智能从仿真到真机的最后一公里。benchmark 第一只是个引子——真正值得跟踪的是它在机器人量产里能不能稳定交付。如果跑分之外它也能在工厂、产线上稳定干活,那世界模型这个词可能要从内容生成赛道,重新分类到具身基础设施。