6月5日腾讯云 AI产业应用大会上,CSIG CEO汤道生与刚加入腾讯半年的首席 AI科学家姚顺雨的一场对谈,把混元3 Preview背后的训练方法论完整公开了:与业界主流的"卷参数、卷 benchmark"相反,腾讯正在走一条"砍数据、化繁为简"的产品驱动路线。 **数据观**:姚顺雨入职后第一件事不是堆 token,而是砍数据。他推动识别并剔除"看似可堆量但实际对训练无帮助甚至有害"的数据,把"数据质量"重新拉回模型训练的核心位置。汤道生评价:"如果你不清楚数据质量的重要性,只是盲目奔着更多 T 的 token,就做不了砍数据这个决策。" **架构观**:沿 scaling law思路,混元3选择了简化架构——去掉不必要的 tricks,把架构做"简单一些",让 scaling真正可扩展。结果是"虽然今天看不是很大的模型,但对比以前已经有很大的进步"。 **产品 co-design**:混元团队与元宝团队现已搬到同一座楼。80% 元宝用户已切换到 Hy3 Preview,包括最新 AI语音识别、方言识别等都以 Hy3 Preview 基模训练。混元3 Preview 的 token 调用量是2.0时期的两倍,留存率也明显提升。 这套组合拳反映了一个转变:在算力紧张、token成本居高不下的当下,"调优产品体验"比"刷榜"更能转化为可持续商业价值。这给后来者一个清醒提醒:模型训练中的"少即是多",前提是真的懂产品、敢砍数据。