[原创] 女儿的学校照片 + 吐槽收费的要价 + 人工智能的解决方法

2018-10-24 05:07:18 +08:00
 coolwulf

又到了一年一度的学校 school picture 时节, 在北美这里有孩子的朋友可能知道, 一般这个时间就是家长得出(tu)钱(xie)的时候了。一般的 school picture 的要价是这样的:

http://thyrsi.com/t6/394/1540328645x-1566684341.jpg

这往往是便宜的,而且一般你家孩子不会只照一张俩张,有时候还会有和其他同学的合照和班级集体照。

随口问了孩子妈,“我们今年买几张”。“全要吧”, 孩子妈头也不回的说。

我简单一算,哎呀妈呀,这还不得好几大百 $ 下去了...

有没有更好的解决方法?然后我想到了 AI, 想到了我那一堆躺在地下室吃灰的显卡 ... (前情提要请看我前面的帖子)

首先我研究了一下 School Picture 提供网站上面提供的学生样品图片。这些样品图片一般是低解析度 (Low Resolution) 和加上了水印 (Watermark) 的给用户提供一个购买之前照片印象的图片。

看了看这些图片,让我想到了使用 SRGANs 和其他的 In Painting Network 来解决这个问题的可能。好吧说干就干吧

首先是原图: http://thyrsi.com/t6/394/1540328673x-1404814676.jpg

使用 ImageNet 的数据,通过 SRGANs 来训练一个 AI 来提升图片的 resolution, 网络结构:

这个网络大概训练了三天多,我看结果似乎还不错,够用了

提升后的图片解析度达到了打印成 8 x 10 或者更大片副的要求,这里是 100% 的 before / after 比较: http://thyrsi.com/t6/394/1540328695x-1404814676.jpg

接下来的问题是水印,我采用了 Nvidia 团队支持不同大小,形状的 Partial Convolution 的解决方法, 论文: http://thyrsi.com/t6/394/1540328723x1822611687.jpg

训练的数据主要是 ImageNet 中的人物数据集,然后我又加上了 CelebA 这个专门的名人头像数据集来作训练

总过花了快俩周的时间才 train 完 (汗,太慢了)。这个 AI 的结果还凑合,暂时可以用了,放一下结果图:

http://thyrsi.com/t6/394/1540328739x1822611687.jpg

当然结果还不够好,可能还需要手工做些 touchup. 不过我打算在继续强化一下这个网络,看看能否提高效果。

然后准备写个简单的网站,这样方便远程使用,年底再去坐 Cruise 的时候看来是不需要再花大价钱买照片了...

哈哈哈...

当我正准备狂笑三声的时候,孩子妈劈头盖脸的问我 "孩子照片你不是说上周就挂家墙上的嘛?“, 我:"..."

5067 次点击
所在节点    问与答
25 条回复
klaksvik
2018-10-24 06:21:33 +08:00
哈哈,楼主这个太赞了。
green15
2018-10-24 07:09:19 +08:00
楼主的思路奇特,技术含量高……收徒弟吗? 23333
xenme
2018-10-24 07:10:56 +08:00
这结尾,😄
DevRoss
2018-10-24 07:28:27 +08:00
哈哈哈
bearqq
2018-10-24 07:29:40 +08:00
拿女儿照片来骗点击量也是蛮拼的
(滑稽
OscarUsingChen
2018-10-24 07:56:53 +08:00
leoojiang
2018-10-24 08:04:44 +08:00
考虑到一个问题:涉不涉及版权……
coolwulf
2018-10-24 08:41:38 +08:00
@OscarUsingChen 或许是的,不过我之所以训练这个网络不仅仅是为了去除 watermark, 还可以针对 loss information 的图片来做修复,对于有损伤的老照片之类的也可以使用。
coolwulf
2018-10-24 08:48:46 +08:00
确实,这个模型可以有其他的应用。
Bryan0Z
2018-10-24 08:50:04 +08:00
你这个好便宜,我们拍的毕业照,一张要 90 刀,最后听说是没人买
harry890829
2018-10-24 09:01:24 +08:00
说起来,这样的话马赛克是否也……
silencefent
2018-10-24 09:07:36 +08:00
在中国打印然后寄过去比美帝便宜
sfree2005
2018-10-24 09:20:59 +08:00
技术上佩服,但这涉及版权问题吧。如果对技术真的很感兴趣,大可用没有版权的图片,或者你已经购买了版权的图片玩玩。
jetyang
2018-10-24 09:50:33 +08:00
孩子脸颊和下巴上还是可以看到很深的字母印记,还要继续加强
SCaffrey
2018-10-24 10:41:31 +08:00
好厉害 Qrz
可以考虑尝试更强大的 SR 网络(?)
takato
2018-10-24 10:48:32 +08:00
那么重新 GAN 一个到底涉及版权吗?
其实很难界定的,毕竟自然的物都遵循某种规则,而这种规则有版权吗?个人认为显然没有吧。。
alexapollo
2018-10-24 10:49:54 +08:00
@SCaffrey SRGAN 目前已经不错了
tutustream
2018-10-24 11:00:54 +08:00
哈哈,LZ 在训练 AI 用 PS 么。
bestkayle
2018-10-24 11:04:41 +08:00
有个疑问,不能自己拍吗
artandlol
2018-10-24 11:31:36 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/500466

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX