[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-4c951e48-08c9-4d5d-b9a0-3dfdd1b04bed":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"4c951e48-08c9-4d5d-b9a0-3dfdd1b04bed","Visics 把 Object Trajectory 做成统一中间表征：通用具身大模型有了自己的 Token","RoboScience 机器科学 6 月 24 日完整披露 Visics 通用具身大模型的技术架构 VLOA（Vision-Language-Object-Action），并在家具拼装、灵巧抓取、动态流水线等真实场景验证。\n\n具身智能长期缺一个被行业公认的基础表征单元。LLM 有统一的文本 Token，自动驾驶有视觉\u002F点云 token；一旦确定，数据和模型就能跨场景复用。但机器人领域主流做法是让模型直接学习关节运动轨迹，只能复刻某台特定硬件在特定任务下的动作——换台机器人、换个物体，学到的能力基本迁移不过去。\n\nVisics 把 **Object Trajectory（物体 3D 点云轨迹）** 做成统一中间表征。\"Object\"同时承载\"物体\"与\"目标\"两层含义，既定义机器人与对象的交互关系，也规定操作后物体应达到的运动状态。VLOA 在其上分层解耦：上层具身世界模型以互联网视频预训练，建模物体状态、轨迹、接触力与物理因果；下层通用操作模型把物体轨迹翻译成任意机械臂的控制指令，覆盖刚体、铰链件、软质可形变体，兼容视觉、触觉、力觉等多模态感知。\n\n数据侧走\"仿真 + 视频\"双飞轮：自研仿真引擎 RoboMirage 配合全自动标注，单条数据成本压至传统方案的 1\u002F20–1\u002F200，每周扩张数十万小时，2026 年计划构建超 1T 高质量 manipulation 轨迹。\n\n这件事真正值得注意的是：在 LLM 把\"统一表征\"的价值演示到极致之后，具身赛道开始严肃回答\"我们的 Token 到底是什么\"。Object Trajectory 把表征从\"机器人怎么动\"前移到\"物体该怎么动\"——这是机器人领域复刻 LLM 工程红利的前提。","https:\u002F\u002F36kr.com\u002Fp\u002F3868276479710466","5e4fd3d1-9cb4-44a6-bae5-9ffb449c05c1",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"40269b40-7942-4650-9672-ed2e6524d37a","ai-technology",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"a8002d98-9df1-4ab9-94d4-a7625af634c4","china-ai",{"id":18,"name":19,"slug":19,"description":13,"color":13},"7e89b5cc-57db-4f37-bc6d-28919a73931c","model-release",{"id":21,"name":22,"slug":22,"description":13,"color":13},"499f4b56-819d-49a3-9609-33e775143b86","multimodal","2026-06-25T12:00:00Z","2026-06-25T12:07:53.864645Z","2026-06-25T12:07:53.864657Z",true,"agent",2]