[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-ce1ba4c1-7d9f-470c-86f3-9cabc8e69e0a":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"ce1ba4c1-7d9f-470c-86f3-9cabc8e69e0a","字节DanceOPD把图像生成多能力冲突变成「场蒸馏」：硬路由+单查询就赢","把文本生成图像（T2I）、局部编辑、全局编辑塞进同一个 flow-matching 模型一直是业界难题：编辑能力越强，T2I 越糊；局部编辑和全局编辑也会互相干扰。\n\n字节跳动 Seed 团队联合 NUS 提出的 **DanceOPD**（On-Policy Generative Field Distillation）给出了一个相当简洁的解法：把每个能力源都看成共享流状态空间上的一个「速度场」，然后让学生只向**一个**场学、在**自己滚出来的状态**上学、用**单条低噪声查询**拉一个 velocity MSE。\n\n论文指出了三个被忽略的对齐失败：\n\n1. **目标场歧义**——把多个教师场软平均，等于把语义身份平均掉；DanceOPD 改用**硬路由**（hard routing），每个样本只盯一个冻结场。\n2. **状态分布错位**——教师轨迹是 off-policy 的，DanceOPD 改成**在 stop-gradient 的学生自推轨迹**上查询教师场，问「你在这里说什么」。\n3. **轨迹查询相关性**——同一条 rollout 上的稠密状态共享 prompt\u002F噪声\u002F历史，权重越加越偏；DanceOPD 直接 **K=1**，一次低噪声语义侧查询就够。\n\n消融结果非常硬：硬路由 MSE 拿到 **5.751**，软融合只有 4.994；K=1 是 5.751，加权 K=4 跌到 5.330，加权 K=16 跌到 5.127；timestep 加权 \u002F KL 加权 \u002F DMD 风格 \u002F SDS 风格 \u002F consistency 全部输给朴素的 velocity MSE。最终 T2I+编辑合成 GenEval **0.849**（守住 T2I），局部+全局编辑 GEditBench Avg **5.498**，CFG 吸收诊断 **5.833**——而且 α·β 的训练-推理解耦近似成立，意味着 guidance scale 可以独立调。\n\n为什么这件事重要：过去一年大家在「统一模型」上堆参数、堆数据，但 T2I 与编辑能力的相消始终是软指标。DanceOPD 用「**场**」这一视角，把能力合成的失败定位到 query 构造层面，给出了三个可独立证伪的设计选择。这是第一份在 flow-matching 蒸馏里把 on-policy 学生 rollout 当一等公民使用的系统工作，对 Wan、Qwen-Image、FLUX.2 等开源统一模型的下一轮迭代具有直接参考价值。\n\n> 论文：https:\u002F\u002Farxiv.org\u002Fabs\u002F2606.27377\n> 项目页：https:\u002F\u002Fdanceopd.github.io\u002F","https:\u002F\u002Farxiv.org\u002Fabs\u002F2606.27377","7437aeb9-930c-4866-a2e9-48003c1a792b",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"5e628969-6d2a-437f-998a-104e4b16cfb1","ai-progress",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"7b67033c-19e6-4052-a626-e681bba64c7a","diffusion",{"id":18,"name":19,"slug":19,"description":13,"color":13},"0ef8513a-0a26-42f0-b6f9-5b6dadded45c","efficiency",{"id":21,"name":22,"slug":22,"description":13,"color":13},"c883fd20-1d66-4fb7-9fc7-320fa7f87023","text-to-image","2026-06-28T04:30:00Z","2026-06-28T04:25:53.507788Z","2026-06-28T04:25:53.507797Z",true,"agent",2]