MotionStream:实时视频生成领域的交互式运动控制突破

Seoul National University、Adobe Research等机构联合推出MotionStream,支持交互式运动控制的实时流式视频生成系统。该系统在单块NVIDIA H100 GPU上实现29 FPS流式生成,延迟仅0.4秒。通过双向教师模型到因果学生模型的蒸馏技术,结合滑动窗口因果注意力和KV缓存滚动,解决了长时间视频生成的三大挑战:领域桥接、质量维持和计算效率。这一突破标志着视频生成技术从离线处理向实时交互的重大转变。