Vera 是 Netflix 与加州理工学院联合发布的分层扩散视频编辑框架,arXiv:2606.23610,2026 年 6 月 22 日上线。核心创新在于把"要编辑的内容"和"要保留的像素"分开建模:编辑层、alpha 蒙版、合成视频各自由独立 DiT 编码,再通过联合自注意力实现跨层一致性。配合 48.6 万帧分层训练集(合成 + 真实单目标 + 多目标带阴影/反射/遮挡),Vera-14B 在 PSNR/SSIM/LPIPS 等内容保护指标上对 VACE、Ditto、Lucy-Edit 等开源基线实现 2-3 倍量级领先,用户研究也获得显著偏好优势。这套思路首次把"可控编辑"和"像素级保护"统一在单一生成框架内。