珍珠晚礼服flux版_含个人的一训练数据
1024版







娜扎的同款珍珠重工裙
食用说明:
1.底模使用fp8-dev(包括F.1 Compact _ CLIP and VAE included_Flux.1-Dev fp8)或基于fp8-dev微调的大模型,不建议使用alt、schnell、nf4等类型。
2.权重1即可。
3.触发词dress\(zhenzhu\),想要羽毛的话加feathers。
下面是我认为的重头戏,只简单使用lora的可以先撤了。
训练过程中的一些数据记录
感谢青龙大佬的训练包,让我的12G的3060也能愉快的炼flux的丹,我把以前基于1.5训练的娜扎同款珍珠裙的训练集拿过来,先在flux上练练手,毕竟服装lora个人认为是最简单的。
训练集:11张,1024*1024,单轮步数4,轮数20
打标:触发词+wd14打标,没用自然语句
unet学习率8e-4,dim32,flpha16
其它参数没调
此次测试主要是想看看显卡在训练集不同分辨率下的表现,我将训练集resolution分别设置了512*512,640*640,768*768,1024*1024四类
| 分辨率 | 速度 | 步数 | 训练总时间 | 显存使用峰值 |
| 512*512 | 12s/it | 880 | 3h11min | 7G |
| 640*640 | 11s/it | 880 | 2h44min | 8G |
| 768*768 | 13s/it | 880 | 3h17min | 9G |
| 1024*1024 | 21s/it | 880 | 5h15min | 11.5G |
(512*512训练时间偏长有可能和我在训练时用电脑做其它事有关)
四类均选了最后一轮的模型进行测试。
基于底模fp8-dev

可以看出来,512、640都能很好的还原服装细节,但手部却很容易出现崩坏,768、1024虽然也还原了衣服细节,但却也增加了一些原服装不该有的东西,这个不能说不好,就看个人需求了。
对比效果和速度,我个人是倾向于以后用768*768进行训练的,在保证lora质量的前提下,速度也还不错。
同时也对在其它类型的flux上进行了测试
基于F.1 Compact _ CLIP and VAE included_Flux.1-Dev fp8 ALT

基于nf4

在这两个底模上,没有画出素材中的衣服,但对画面细节进行了优化(不看训练素材,光看对比图,会以为这是个差异丹吧),感觉可以当个add detailer用
基于schnell

有一定还原度,但这画质,也就呵呵了(坐等字节开源加速版)
