商汤日日新 SenseNova-U1 Pro 曝光：把「理解·生成·行动」原生统一塞进一个基座，7 月邀测

商汤把理解·生成·行动三件事压进同一个模型基座了。 6 月 25 日，36氪披露商汤日日新新成员 SenseNova-U1 Pro，定位业界首个以理解·生成·行动原生统一为内核的多模态智能体基座，7 月邀测。这是商汤在 4 月开源 SenseNova U1（NEO-unify 架构）后，把行动维度纳入统一框架的关键升级。传统做法是拼接：视觉/语言理解外挂到生成模型，再外接 Agent 框架走 tool use。代价是表征割裂、延迟高、一致性难保证。原生统一把理解、生成、决策压进同一套 token 空间端到端训练——这正是 Gemini 2、GPT-5 系列已走的路线，但能在多模态 + Agent 维度同时原生统一的基座仍属少数。 U1 Pro 的差异化在于把行动提到与理解·生成并列的一等公民：具身操作、工具调用、长程规划这些原本依赖外挂 RL 或 SFT 的能力，被压进预训练统一目标里。短期风险明显——稳定性、灾难性遗忘、能力相互挤兑都是硬骨头；长期收益是部署侧低延迟和一致性，对实时 Agent 尤为关键。中国大模型厂商在多模态 Agent 基座上的路径正在分化：Qwen 系走 AgentWorld 把语言世界模型做成统一入口；商汤则把原生统一多模态 Agent 基座作为旗舰叙事。U1 Pro 邀测结果会是 agentic 时代第一个公开校验点，7 月值得关注。