最近在研究 AI 图片生成,发现了个挺有意思的模型,顺手分享一下。 https://uni-1.me/
用过 Midjourney 和 Flux 的应该都知道,这类模型的通病是"听话"程度参差不齐——提示词写得很细,出来的图还是跑偏,空间关系错,多角色场景更是一塌糊涂。
最近试了个叫 Uni-1 的模型,底层逻辑和别的不太一样——它在生成之前会先做推理,把提示词拆解、分析空间约束、规划构图,然后再出图。实际体验下来,复杂场景的还原度确实比 Midjourney 强一截,多人物合照基本一次过。
另外支持上传最多 8 张参考图做身份锚定,风格迁移也比较稳,不会出那种"参考了但完全不像"的情况。支持 76+ 种风格,日系漫画、电影感、产品摄影都能跑。
生成前先推理——比单纯堆模型参数更有意思,感兴趣的可以看看。
1
liu731 PRO 感谢分享。测试了一下,严重怀疑是 FLUX-2 的底子魔改的。不过逻辑性确实强点~
|