[3 更] 解决真实照片转拼豆的痛点,我给生成器接了多模态大模型

5 小时 3 分钟前
 iyuanyi

我又来了(这已经是第三更了,Vibe Coding 真的太容易上头了🤣)。

前两贴链接防迷路:

看到有 V 友做了拼豆站,手痒也 Vibe Coding 了一个拼豆图纸生成器

Update 昨天发完帖后,我把拼豆生成器做上头了:画廊、在线编辑、用户系统全搞定

在这两天的测试和大家热心的反馈中,我发现了一个非常致命的痛点:真实照片直接转像素拼豆,简直是灾难! 复杂的背景、阴影、渐变色经过像素化后,全变成了密密麻麻的噪点。真要做成实物的话,你可能需要买 50 种不同色号的豆子,而且拼出来人物连五官都糊在一起了,根本没法看。

为了解决这个“没法落地”的问题,这版我做了一个重量级更新:

  1. 接入阿里百炼大模型( Wan2.7 ),一键提取线稿平涂 我在生成器里加了个「✨ 一键优化底图」的功能。底层接了多模态大模型的 API ,写了一段极度苛刻的 Prompt ,强迫 AI 把复杂的照片转换成类似“儿童涂色书”的极限扁平化风格。出来的原图再过一遍我的像素化算法,那叫一个清爽!

  2. 严格控制色号数量(算法层面) 光有 AI 优化还不够,我还在前端加了色彩聚类算法,支持严格限制最大颜色数(比如一幅画最多只用 10 种颜色的拼豆)。这绝对是手工党福音,再也不用为了几颗冷门颜色的豆子去硬凑单包邮了。

  3. CF 生态全家桶踩坑:限流与定制邮件 因为大模型 API 是要花钱的,防白嫖机制必须安排上。 我用 NextAuth + Cloudflare D1 数据库给 AI 优化加了每日 3 次的限频。

现在看着终于像个正经的商业级产品了。

体验地址 折腾了这么多,感觉在同类产品里应该算是非常能打的梯队了。

体验地址:https://pindouai.app

(注:核心的图纸生成、编辑、画廊都是完全免登录的。只有「一键优化底图」需要点一下邮箱验证码登录,毕竟调大模型是要烧我的 token 的,每天给大家免费用 3 次,大佬们手下留情 🐶)

继续欢迎大家体验,多提 Bug 和建议!

268 次点击
所在节点    分享发现
0 条回复

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1222226

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX