SD 要生成满意的图比我想象的难很多

1 天前
 iixy
我的需求就是 1:1 复刻我喜欢的动漫角色,因此我一直对于那种写一些提示词,生成八竿子打不着的图片没有任何兴趣,也许对某些人的写文配图是有用的。SD 可以自己训练 lora 使我看到了福音,因此就尝试了一下。

第一步我只求还原度,跟原作一毛一样最好;第二步可以加些我想要的动作;第三步才是尝试 yellow 风。

但是现在第一步我都觉得相当难了,为了还原我都是用 SD1.5 ,配原版动漫截图,生成出来的效果还是不满意。

仔细想想,标签,图源,底模,提示词,采样方法那些杂七杂八的参数都会影响结果。随机性真是太大了,不愧是炼丹。我现在在想要不要放弃,这个学习成本都快赶上 3D 建模了。
1674 次点击
所在节点    Stable Diffusion
21 条回复
Muniesa
1 天前
动漫直接用光辉模型啊,自己训练当然复杂
iixy
1 天前
@Muniesa 光辉模型是哪个关键词,我试试。 但是我想要还原度所以才想自己训练。
linch97
1 天前
2025 年了怎么还在用 sd1.5 ,社区模型选 noob ,闭源付费的直接用 nai ,别折腾 sd1.5 了
Muniesa
1 天前
@iixy wai-illustrious-sdxl https://civitai.com/models/827184/wai-illustrious-sdxl
也有 nsfw 模型
iixy
1 天前
@linch97 刚学,b 站说这个原始用这个。
love060701
1 天前
开源用 Flux 、SDXL 微调过的模型,闭源用 nano banana 、即梦 4.0 ,SD 已经彻底被淘汰了
iixy
1 天前
@Muniesa 好的谢谢
linch97
1 天前
@iixy #5 别看过时教程了,跑二次元直接选 noob ,是 sdxl 架构,基于 illustrious xl 0.1 训练的,就上楼上提的光辉。训练 lora 的要点和 sd1.5 基本互通。
不想自己折腾开源模型就付费玩 nai ,上限和下限都更高,只是没那么自由
qiaobeier
1 天前
@iixy #5 信息滞后了。
jifengg
1 天前
如果回 comfyui ,建议可以试试 qwen-image-edit-2509 ,可以先在 https://chat.qwen.ai/ 这里体验一下。
sairoa
1 天前
听楼上的用基于光辉的微调模型,然后选个作品多画风喜欢的画师,加进提示词里,然后角色名称就行,画师和角色提示词参考 danbooru ,目前来看除非特别新或特别冷门的角色,都直接出不用 lora 。
iixy
1 天前
@sairoa 国漫呢..
rxmt
1 天前
我支撑设计团队用各种模型,不懂设计和视觉,单纯讨论一下。为啥现在还会用 sd1.5 做?是因为硬件跟不上么。目前我能接到的需求,基本都是 flux 系列、qwen-image 系列,做 lora 、工作流以及调上下文,另外 nano-banana 这种会找接口糊 web ui 出来。
感觉 sd1.5 比较过时了,模型能力可能也比较弱,op 试试更新的?
beefhotpot
1 天前
有很多网站支持在线训练模型的,甚至你想训练的模型已经有了,搜下就有
iixy
1 天前
@rxmt 因为 b 站 up 主说 1.5 最原始,干扰因素少。因为我不想要花里胡哨的风格,只想还原,所以就用这个了。
haoooooooo
1 天前
SD 模型现在已经落后太多了
clementewy
1 天前
1:1 复刻 只有自己炼了
rxmt
1 天前
@iixy 奥奥,我是这么理解的,每个模型都有不同的特性,比如:sd 系列的提示词写法简单说是 1 个词 1 个词的,根据模型本身、lora 触发词等设计,模型对特定词语的遵循性更强(包括正向以及反向),对提示词中的一些细节反而不那么敏感; flux 系列则会更遵循生图的提示词,在训练的时候提示词编写特点就变成了用简短的白话或者词句描述图像内容,素材集特点也会改变,生图的时候对提示词遵循更加严格,而模型本身的规则弱化了一些。我表达的不太专业可能。。

关于干扰因素和花里胡哨,我可能有点不认可,模型本身的性能会限制发挥,还原性或者说角色一致性看能也会差。换新模型,考验的是摸索提示词技巧的能力,性能更好的模型其实一致性能力上限或更高。举个我遇到的问题:我有一段时间想要做一种毛绒绒质感的卡通形象,但是 sd15 ,sdxl 出来的角色边缘效果很糊,一些特点(高矮胖瘦、五官尺寸等等)还原的有偏差。但是尝试性能更好的模型,往往摸索后就能解决。

如果 op 有精力的话可以尝试,细节要求不高或者对这块投入的精力有限还是在 sd15 上做也没太大问题,这种效果评估多少还是比较主观的。
iixy
1 天前
@rxmt 哈哈,所以我吐槽的就是随机性太强了。我在考虑花这么多功夫还不如试试建模算了。
FireKey
1 天前
先去 c 站找找大佬们训练的 lora,大部分角色是有的,省了重复造轮子的功夫.动漫风目前最好的是 illustrious 模型,搜索的时候把这个筛选项选上,一般训练出来的模型质量都不差.
炼丹的话还原其实不是难事,批次多些总有满意的.出图我建议自己写个脚本工具,根据自己提供的词轮流生图,总有满意的.我一般挂个一晚上能生成千八百张图,然后在自己挑选满意的图片保存.

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1168790

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX