计算机视觉模型,需求是对比两张图片的相似度,求指点或者有大佬愿意尝试一下,可有偿

64 天前
 daohuo

本人对这块一窍不通,目前借着 GPT 根据颜色和人体姿态求的相似度,东拼西凑的做出来了,只能说差强人意,堪堪能用,领导希望一个模型解决问题,并且随着训练的材料越多,模型越准确

基于需求,标照片和客片这两张图,即使是按照人眼评判标准相似度足够的,也可能在整体饱和度,亮度,色调,人体姿态,背景颜色等有差异

而需要评判的图片,背景,物体和人物姿态,衣服都会有变化

如果有直接能用的开源项目,或者不需要太多相关知识就能达成的学习路线,希望有大佬指点一二

或者有大佬愿意尝试,可以谈一下报酬看看我们领导是否能接受

2366 次点击
所在节点    Python
30 条回复
daohuo
64 天前
@DIMOJANG 好的,感觉这个度量学习比较接近需求,我去看看
NoOneNoBody
64 天前
你的描述并没有说清需求,这个“相似度”是如何定义的?
一个百分比数值?那还需要定义权重,颜色、主体(如人物)哪个重要
如果没有定义,纯整体比较,计算 mse 就是了,很简单的一两行代码(用 pyvips 就一行)
一般说“相似度”就是求 mse ,但以你的描述,则是比较复杂,颜色、明暗度都要判断,还有主体姿态

其他方面去看 opencv.img_hash 模块的各种计算,模块内有两图计算值 compute 方法,得出的是单一浮点数

如果主体的姿态还需要描述的话,例如站着、坐着、单手上举……需要能描述的模型
如果只是找出不同,不需要描述,按下面找茬方式就行


找出不同之处?就是类似“找茬”游戏
找茬核心是 skimage.metrics.structural_similarity ,根据其计算结果,在 mask 上描线
网上有例子和代码

其实两图尺寸和内容基本一致的话,找成对相似是比较容易的,都有现成的模块可以完成
我遇到的难题是旋转、裁边(将原图裁掉边缘部分,多数是因为切去水印,然后放大到原尺寸)……这些就很棘手
ihciah
64 天前
https://github.com/ihciah/deep-fashion-retrieval
贴一个 7 年前的代码,是不是类似需求?评判相似度并做 retrieval 。
“相似”的定义是不好描述的,所以需要你收集相似的和不相似的样本并 finetune 一下网络。
tfdetang
64 天前
如果是私有场景,估计很难直接通过开源模型实现吧,最起码要自己训练或者(few shot)。 我个人觉得这个场景类似于小区的人脸识别门禁那种 pair-wise 的思路,是用两个正例对与负例组成样本对来找出相似度边界
DigitalG
64 天前
听上去你的标准有些模糊。打分标准不明确的话,不是很好做。至少细化下“如何判断相似度”的规则,要达到能够给标注团队看过之后能制作训练集的程度吧。

而且你提到人眼也无法判断的情况。我倾向建议不要依赖单一模型去解决。比如由多个不同的模型分别或依次判断,单一模型只提供某个方面的相似度评分。最后综合判断,你可以简单设置多个阈值,每个模型的评分可以有自己的权重(或者这个步骤用另一个回归模型得到一个总分)。

另外,上面说的多个不同的模型,也可以加入传统 cv 的方法去判断饱和度等,不一定非得深度学习。(这也不会影响训练材料越多,模型约准确的要求)
EndlessMemory
63 天前
这个一般使用孪生神经网络吧
loadingimg
63 天前
openmynet
63 天前
如果相似度受到整体饱和度,亮度,色调,人体姿态,背景颜色的方面的影响,感觉 image hash 可能更适合你
SunDoge
63 天前
我觉得这个需求挺有意思的,想试试,能提供一些 example data 吗?
yichengxian
63 天前
Deeplearning4j

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1031584

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX