[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"news-bf8755fc-cd4f-4bd9-9617-e70f56ddc4ac":3},{"id":4,"title":5,"summary":6,"original_url":7,"source_id":8,"tags":9,"published_at":23,"created_at":24,"modified_at":25,"is_published":26,"publish_type":27,"image_url":13,"view_count":28},"bf8755fc-cd4f-4bd9-9617-e70f56ddc4ac","LTX-2.3：开源视频生成正式进入 4K + 原生音频时代","3月5日，Lightricks 发布 LTX-2.3，一款 220 亿参数的开源视频生成模型。不同于以往开源方案只能在低分辨率下运行，LTX-2.3 支持最高 4K 分辨率、50fps 的视频输出，并首次在开源生态中实现了真正的音视频同步——这在以前只有 OpenAI Sora、Runway 等闭源模型才能做到。\n\n技术层面，LTX-2.3 有几个值得关注的突破：重建了潜空间（latent space）并重新训练了 VAE，在头发、织物边缘、文字等细节保留上明显提升；文本控制器的规模扩大了 4 倍，复杂 Prompt 的解析能力大幅增强；更重要的是音频驱动视频生成能力——模型可以基于语音、音乐的节奏来组织画面结构，这是开源视频模型此前从未真正实现的功能。\n\n产品层面，LTX-2.3 采用 Apache 2.0 许可证，支持商用、本地部署和自行微调。对于有数据隐私要求或成本敏感的企业，这意味着视频生成能力不再被少数闭源方案垄断。模型可通过 Lightricks API 调用，也支持本地部署 weights。\n\n但需要客观看到，220 亿参数规模对硬件要求依然较高，完整功能需要专业级 GPU 才能流畅运行，并非普通开发者的玩具。\n\n开源视频模型和闭源方案之间的差距，2025 年以前还是「能用 vs 好用」的差别，到 2026 年 DiT 架构全面成熟后，两者的体验差距正在快速收窄。LTX-2.3 的出现是一个信号：开源视频生成进入生产环境的时间窗口，已经比预想中更近了。","https:\u002F\u002Fltx.io\u002Fmodel\u002Fltx-2-3","234f16d5-2704-4fbf-b70a-059c5164830d",[10,14,17,20],{"id":11,"name":12,"slug":12,"description":13,"color":13},"7b67033c-19e6-4052-a626-e681bba64c7a","diffusion",null,{"id":15,"name":16,"slug":16,"description":13,"color":13},"0ef8513a-0a26-42f0-b6f9-5b6dadded45c","efficiency",{"id":18,"name":19,"slug":19,"description":13,"color":13},"b9bd9039-fcdb-41a8-b85b-fc1587def2b9","open-source",{"id":21,"name":22,"slug":22,"description":13,"color":13},"ebe5dcd1-46b1-4298-b8c2-8e0e2f456e56","video-generation","2026-06-02T01:00:00Z","2026-06-02T01:07:05.950376Z","2026-06-02T01:07:05.950388Z",true,"agent",2]