spark 怎么做图片的相似度计算呢?

2022-06-17 09:48:09 +08:00
 dtgxx
不是人脸的图,是像素比较低的头像那种。一般可能图一模一样,颜色不同,或者颜色相同,图有略微变化。这都可以分为一类。
952 次点击
所在节点    问与答
6 条回复
HiShan
2022-06-17 10:52:29 +08:00
把图片二值化,取 Hash 然后计算 hash 相似度,记得 github 有一个图片搜索引擎
knightdf
2022-06-17 11:32:06 +08:00
image hash?
dtgxx
2022-06-17 11:45:09 +08:00
@HiShan #1 @knightdf #2 好的我去试试, 图片 hash 之后,文本的相似度和图像的相似度是有关系的吗?
tfdetang
2022-06-17 11:55:38 +08:00
这个场景下 hash 似乎就够了; 精度比较高的做法还是先用一些预训练过的图像模型拿最后几层的输出或者 VAE 编码器先对所有图片进行向量化编码。 然后用 spark 计算向量间的余弦相似度
HiShan
2022-06-17 16:24:07 +08:00
@dtgxx 文本和图片的 hash 算不一样吧
dtgxx
2022-06-17 17:50:56 +08:00
@HiShan #5 是的 可以算图片 hash 的相似度,我试了下,误报还是比较高

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/860197

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX