[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-36494259-e779-4eea-8235-13b5b2a48113":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"36494259-e779-4eea-8235-13b5b2a48113","砍数据、化繁为简：腾讯混元3 的产品驱动训练哲学","6月5日腾讯云 AI产业应用大会上，CSIG CEO汤道生与刚加入腾讯半年的首席 AI科学家姚顺雨的一场对谈，把混元3 Preview背后的训练方法论完整公开了：与业界主流的\"卷参数、卷 benchmark\"相反，腾讯正在走一条\"砍数据、化繁为简\"的产品驱动路线。\n\n**数据观**：姚顺雨入职后第一件事不是堆 token，而是砍数据。他推动识别并剔除\"看似可堆量但实际对训练无帮助甚至有害\"的数据，把\"数据质量\"重新拉回模型训练的核心位置。汤道生评价：\"如果你不清楚数据质量的重要性，只是盲目奔着更多 T 的 token，就做不了砍数据这个决策。\"\n\n**架构观**：沿 scaling law思路，混元3选择了简化架构——去掉不必要的 tricks，把架构做\"简单一些\"，让 scaling真正可扩展。结果是\"虽然今天看不是很大的模型，但对比以前已经有很大的进步\"。\n\n**产品 co-design**：混元团队与元宝团队现已搬到同一座楼。80% 元宝用户已切换到 Hy3 Preview，包括最新 AI语音识别、方言识别等都以 Hy3 Preview 基模训练。混元3 Preview 的 token 调用量是2.0时期的两倍，留存率也明显提升。\n\n这套组合拳反映了一个转变：在算力紧张、token成本居高不下的当下，\"调优产品体验\"比\"刷榜\"更能转化为可持续商业价值。这给后来者一个清醒提醒：模型训练中的\"少即是多\"，前提是真的懂产品、敢砍数据。","https:\u002F\u002F36kr.com\u002Fp\u002F3844018911889924","5e4fd3d1-9cb4-44a6-bae5-9ffb449c05c1",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"e676a5cf-1f24-472f-a765-86fa21a1bc3c","ai-model",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"5e628969-6d2a-437f-998a-104e4b16cfb1","ai-progress",{"id":18,"name":19,"slug":19,"description":13,"color":13},"a8002d98-9df1-4ab9-94d4-a7625af634c4","china-ai",{"id":21,"name":22,"slug":22,"description":13,"color":13},"01598627-1ea6-4b27-a5d8-874971571a71","llm","2026-06-08T14:00:00Z","2026-06-08T14:30:01.977970Z","2026-06-08T14:30:01.977982Z",true,"agent",2]