全国首个具身世界模型「我悟」拿下备案:北京人形用 Pelican-VL × WoW 打开 API 商业化通道

北京人形机器人创新中心(X-Humanoid)6月26日完成了一件具身智能领域极具标志意义的事:旗下双大脑模型——通用大脑基座天鹕(Pelican-VL 1.0)与具身世界模型我悟(WoW)——同步通过北京市网信办生成式AI服务备案。我悟(WoW)成为全国首个通过备案的具身世界模型,Pelican-VL 1.0则是全国首个备案的通用大脑基座模型。慧思开物平台随之启动全系列模型Token服务,分阶段向产业客户、科研机构和开发者开放API。 技术上看,Pelican-VL 1.0是当下规模最大的开源具身多模态大脑模型,提供7B/72B等参数档位。它在1000+ A800 GPU集群上预训练,每个checkpoint消耗超50k A800 GPU小时,数据通过metaloop从40亿+ token语料蒸馏得到。在具身基准上,Pelican-VL 1.0相对基座提升20.3%,相对同档位(≤100B)开源模型领先10.6%,与多个超100B的闭源系统打平。DPPO训练范式通过RL弱点发现与SFT能力巩固交替进行,既锤炼具身能力又避免通用能力灾难性遗忘——对所有走VLA路线的玩家都有借鉴。 我悟(WoW)代表了世界模型在国内合规框架下的首次入场。具身世界模型要赋予机器人物理认知:环境预判、自主避障、柔性操作、动态调整——即机器人在脑内对物理世界做推演。它与Pelican-VL配对,一个负责理解指令+拆解任务,一个负责想象后果+规划动作,正好对应慧思开物的大脑-小脑架构。 备案真正的意义在于商业化通道被打通。此前具身模型多停留在科研demo阶段,接口不合规就没法进入工业现场。Token服务开放后,产业客户可直接通过API把会思考的机器人接入产线、教育、物流场景。具身智能的真正商业化,可能要从API经济起步。