意昂体育

FLUX.1-Krea「dev」如何用 2 个训练阶段,把“AI 味”彻底洗掉?

发布日期:2025-08-18 21:14点击次数:60

在 AI 图像生成圈里,我们最怕得不是“画得不像”,而是“一眼 AI”。过度饱和的天空、塑料质感的皮肤、不自然的景深——这些“AI 味”让再精致的画面也瞬间出戏。

今天,Black Forest Labs × Krea AI 联合开源的 FLUX.1-Krea [dev] 给出了根治方案:一套被称为“后训练美学手术”的两段式流程,让模型学会的不只是“像”,而是“真”。下面,我们把整篇技术报告拆成一篇公众号爽文,带你看懂它如何把 AI 味洗到 0。

01 先给 AI 味做个“CT”

官方把 AI 味拆成 3 个病灶:• 颜色病变:饱和度拉满,天空蓝到发光。• 光影骨折:高光死白、阴影死黑,背景像被肥皂泡糊住。• 皮肤塑料化:毛孔、细纹、布料纤维全部磨平。

病根不是数据不够,而是“好/坏”混在一起,模型学歪了。于是,FLUX.1-Krea [dev] 干脆把“预训练”当成毛坯房,后训练阶段直接做精装修——只学人类挑出来的好图。

02 精装修第一步:SFT(监督微调)——给模型上“大师课”

• 教材:几千张人工精选的“教科书级”照片,光影、色彩、构图全部在线。• 教法:让模型在这些图上做“临摹”,把坏习惯一次性矫正。• 黑科技:自定义损失函数,直接在 CFG(无分类器引导)分布上微调,保证文字提示不跑偏。

一句话总结:先让模型知道“什么是好”,再让它学会“怎么稳定输出好”。

03 精装修第二步:RLHF(人类反馈强化学习)——让模型考“美术高考”

• 出卷:模型一次生成 4~8 张图,人类标注员做“二选一”审美判断。• 打分:用这些偏好数据训练一个 Reward Model,相当于给 AI 请了一位阅卷老师。• 刷分:PPO 强化学习算法上场,模型参数不断往高分方向迭代。

为了卷到极致,团队还用了 TPO(Tuned Preference Optimization),多轮“复读”:人类评图 → 训练 Reward → 更新模型 → 再评图…… 循环 5~7 轮,直到审美疲劳也被克服。

04 术后效果:AI 味 0,真实感 100

官方放出的对比图里,同一句 prompt:• 基础模型:天空蓝到溢出,人物皮肤像蜡像。• FLUX.1-Krea [dev]:天空层次肉眼可见,皮肤毛孔、布料纹理真实还原,景深像 50mm F1.4 镜头拍出来的一样温柔。

最重要的是,它开源。开发者可以直接在 Hugging Face 拉到模型权重,商业项目也只用遵守 Apache-2.0 许可证。

05 创意人怎么用?

• 广告 agency:一句 brief 直接出 4K 氛围图,客户现场拍板。• 游戏美术:角色设计草稿 30 秒一张,策划再也不是“先等图”。• 影视 Pre-vis:导演现场改台词,AI 实时出特效预览,节省 70% 预算。• 独立设计师:图标、纹理、背景一键生成,灵感不再卡壳。

推荐资讯