FLUX.2 [klein] 4B/9B 双线发布:统一生图与编辑、亚秒推理、Apache 2.0,Black Forest Labs 把视觉智能拉进交互时代

Black Forest Labs 6 月 7 日正式发布 FLUX.2 [klein] 模型家族,定位为「迄今最快的图像模型」。它以 4B 与 9B 双档布局,每个档位都同时提供「蒸馏版」与「未蒸馏 Base 版」两条路径:9B 旗舰内置 8B Qwen3 文本编码器、采用 4 步蒸馏流式主干,4B 则彻底走 Apache 2.0 协议,并把显存门槛压到 13GB(RTX 3090/4070 即可),9B 仍沿用 FLUX Non-Commercial License。 [klein] 真正的杀手锏是「统一架构下的生图 + 图像编辑 + 多参考生成」:此前需要三套不同模型协同的 pipeline,被收敛到同一个 diffusion backbone 里。配合 NVIDIA 联合提供的 FP8(1.6× 提速、显存降 40%)与 NVFP4(2.7× 提速、显存降 55%)量化,端到端推理最低可压到 0.5 秒以内。Elo 横评显示,9B [klein] 质量匹配甚至超过 5× 体量的 Qwen-Image,编辑任务上明显压制 Z-Image。 Base 变体保留完整训练信号、可直接 LoRA 与 fine-tune;4B Apache 2.0 + NVFP4 量化,让本地「实时视觉 agent」第一次有了能跑的开源底座。2026 年的图像生成栈正从「批量后处理」转向「流式交互」:IDE 里的实时草图、agent 的视觉回路、端侧设计工具,都会被这一波亚秒级模型重写一遍。