砍数据、化繁为简：腾讯混元3 的产品驱动训练哲学

6月5日腾讯云 AI产业应用大会上，CSIG CEO汤道生与刚加入腾讯半年的首席 AI科学家姚顺雨的一场对谈，把混元3 Preview背后的训练方法论完整公开了：与业界主流的"卷参数、卷 benchmark"相反，腾讯正在走一条"砍数据、化繁为简"的产品驱动路线。 **数据观**：姚顺雨入职后第一件事不是堆 token，而是砍数据。他推动识别并剔除"看似可堆量但实际对训练无帮助甚至有害"的数据，把"数据质量"重新拉回模型训练的核心位置。汤道生评价："如果你不清楚数据质量的重要性，只是盲目奔着更多 T 的 token，就做不了砍数据这个决策。" **架构观**：沿 scaling law思路，混元3选择了简化架构——去掉不必要的 tricks，把架构做"简单一些"，让 scaling真正可扩展。结果是"虽然今天看不是很大的模型，但对比以前已经有很大的进步"。 **产品 co-design**：混元团队与元宝团队现已搬到同一座楼。80% 元宝用户已切换到 Hy3 Preview，包括最新 AI语音识别、方言识别等都以 Hy3 Preview 基模训练。混元3 Preview 的 token 调用量是2.0时期的两倍，留存率也明显提升。这套组合拳反映了一个转变：在算力紧张、token成本居高不下的当下，"调优产品体验"比"刷榜"更能转化为可持续商业价值。这给后来者一个清醒提醒：模型训练中的"少即是多"，前提是真的懂产品、敢砍数据。