黑森林实验室发布FLUX.2 [klein]:紧凑型流动模型用于交互式视觉智能
黑森林实验室发布了FLUX.2 [klein],这是一系列紧凑型图像模型,旨在针对消费级硬件上的交互式视觉智能。FLUX.2 [klein]在FLUX.2系列的基础上,加入了亚秒级生成和编辑功能、统一架构以支持文本到图像和图像到图像的转换,以及本地GPU到云API的部署选项,同时保持了最先进的图像质量。
从FLUX.2 [dev]到交互式视觉智能
FLUX.2 [dev]是一款针对文本条件图像生成和编辑的32亿参数正则化流变换器,包括与多个参考图像的组合,主要在数据中心级加速器上运行。它经过调整,以实现最大质量和灵活性,具有长达数小时的采样周期和高VRAM需求。
FLUX.2 [klein]采用了相同的设计方向,将之压缩成了参数较小的4亿和9亿参数的正则化流变换器。这些模型 wurde 蒸馏成了非常短的采样周期,支持相同的文本到图像和多个参考编辑任务,并在现代GPU上优化以实现低于1秒的响应时间。
模型系列和功能
FLUX.2 [klein]家族通过单一架构包含4种主要的开源权重变体。
- FLUX.2 [klein] 4B
- FLUX.2 [klein] 9B
- FLUX.2 [klein] 4B Base
- FLUX.2 [klein] 9B Base
FLUX.2 [klein] 4B和9B是逐步蒸馏和指导蒸馏模型。它们使用4个推理步骤,定位为生产和交互式负载的最快选项。FLUX.2 [klein] 9B结合了9B流模型和8B Qwen3文本嵌入器,并被称为在文本到图像、单参考编辑和多参考生成方面的Pareto前沿上的旗舰小型模型。
Base变体是没有蒸馏的版本,具有更长的采样周期。文档中将它们列为基础模型,以保留完整的训练信号并提供更高的输出多样性。它们旨在用于微调、LoRA训练、研究管道和更重要的是定制pipeline的定制后训练工作流程。
所有FLUX.2 [klein]模型都支持同一架构中三个核心任务。它们可以从文本生成图像,可以编辑单个输入图像,还可以执行多参考生成和编辑,其中多个输入图像和一个提示符共同定义目标输出。
延迟、VRAM和量化变体
FLUX.2 [klein]模型页提供了在GB200和RTX 5090上的大约端到端推理时间。FLUX.2 [klein] 4B是最快的变体,每张图像大约需0.3到1.2秒,具体取决于硬件。FLUX.2 [klein] 9B针对约0.5到2秒的高质量。Base模型需要数秒钟,因为它们使用50步采样周期,但它们提供了更多灵活性,用于自定义pipeline。
FLUX.2 [klein] 4B模型卡表明4B适合大约13GB的VRAM,适合RTX 3090和RTX 4070等GPU。FLUX.2 [klein] 9B卡报告需要约29GB的VRAM,针对RTX 4090等硬件。这意味着一张高端消费级显卡可以托管蒸馏变体,以全分辨率采样。
为了将覆盖范围扩展到更多设备,黑森林实验室还发布了所有FLUX.2 [klein]变体的FP8和NVFP4版本,与NVIDIA共同开发。FP8量化描述为最高1.6倍的速度,最高40%的更低VRAM使用率,NVFP4在RTX GPU上最高2.7倍的速度,最高55%的更低的VRAM使用率,同时保持核心功能不变。
与其它图像模型的基准测试
黑森林实验室通过Elo风格的比较在文本到图像、单参考编辑和多参考任务上评估FLUX.2 [klein]。性能图表显示了FLUX.2 [klein]在Elo评分与延迟以及Elo评分与VRAM的Pareto前沿。评论指出,FLUX.2 [klein]在延迟和VRAM方面以极小的成本匹配或超过了基于Qwen的图像模型的质量,并且它在同一架构中支持统一文本到图像和多参考编辑,超过了Z Image。
基础变体以一些速度换取完全的可定制性和微调,这与它们作为新研究和特定领域的pipeline基础检查点的角色相一致。
关键要点
- FLUX.2 [klein]是一个紧凑的正则化流变换器系列,具有4B和9B变体,支持在一个统一的架构中执行文本到图像、单图像编辑和多参考生成。
- 精炼的FLUX.2 [klein] 4B和9B模型使用4个采样步骤,并优化为单个现代GPU上的亚秒级推理,而未经精炼的Base模型使用更长的进度表,旨在用于微调和研究。
- 与NVIDIA共同开发的量化FP8和NVFP4变体,可在RTX GPU上提供最高1.6倍的速度提升,VRAM使用率降低约40%,NVFP4最多2.7倍的速度提升,约55%的VRAM降低。
查看技术细节、代码库和模型权重。还请随意关注我们的Twitter,别忘了加入我们的10万+ ML SubReddit和订阅我们的时事通讯。等!你还在Telegram上吗?现在你可以在Telegram上加入我们。
文章[Black Forest Labs发布FLUX.2 [klein]:交互式视觉智能的紧凑型流模型](https://www.marktechpost.com/2026/01/16/black-forest-labs-releases-flux-2-klein-compact-flow-models-for-interactive-visual-intelligence/)首先出现在**[MarkTechPost](https://www.marktechpost.com)**上。