商汤日日新 SenseNova-U1 Pro 曝光:把「理解·生成·行动」原生统一塞进一个基座,7 月邀测

商汤把理解·生成·行动三件事压进同一个模型基座了。 6 月 25 日,36氪披露商汤日日新新成员 SenseNova-U1 Pro,定位业界首个以理解·生成·行动原生统一为内核的多模态智能体基座,7 月邀测。这是商汤在 4 月开源 SenseNova U1(NEO-unify 架构)后,把行动维度纳入统一框架的关键升级。 传统做法是拼接:视觉/语言理解外挂到生成模型,再外接 Agent 框架走 tool use。代价是表征割裂、延迟高、一致性难保证。原生统一把理解、生成、决策压进同一套 token 空间端到端训练——这正是 Gemini 2、GPT-5 系列已走的路线,但能在多模态 + Agent 维度同时原生统一的基座仍属少数。 U1 Pro 的差异化在于把行动提到与理解·生成并列的一等公民:具身操作、工具调用、长程规划这些原本依赖外挂 RL 或 SFT 的能力,被压进预训练统一目标里。短期风险明显——稳定性、灾难性遗忘、能力相互挤兑都是硬骨头;长期收益是部署侧低延迟和一致性,对实时 Agent 尤为关键。 中国大模型厂商在多模态 Agent 基座上的路径正在分化:Qwen 系走 AgentWorld 把语言世界模型做成统一入口;商汤则把原生统一多模态 Agent 基座作为旗舰叙事。U1 Pro 邀测结果会是 agentic 时代第一个公开校验点,7 月值得关注。