怎么实现提取俩个图片的一些特征,然后进行特征比对

2025 年 5 月 13 日
 hmxxmh

图片有这些特征:颜色、形状、清晰度、是否 ps

3964 次点击
所在节点    机器学习
22 条回复
draymonder
2025 年 5 月 13 日
是想比对图片是否相似/相同么? 建议直接用多模态 LLM
pulutom40
2025 年 5 月 13 日
图片哈希?机器学习+余弦相似度?你直接上两个 demo 图片吧,这么说谁知道你要干啥啊
liuidetmks
2025 年 5 月 13 日
提取梯度信息?
hmxxmh
2025 年 5 月 13 日
@pulutom40
@draymonder
@liuidetmks 类似于这种发票的图片: https://img.picui.cn/free/2025/05/13/6823195e4a1e1.jpg ,需要提取发票里面的印章,然后进行比对,提取印章用目标检测然后抠图,就是比对这一块,要提取出印章的颜色、形状这些再去比看是否不一致
sunnysab
2025 年 5 月 13 日
可以问一下 AI ?

不是做这方面的。我有个思路供参考:找到图片中的红色(或其他彩色)部分(如图有两个),取最大的,裁剪出来。和你要比对的印章图缩放到统一大小,然后进行相似度比对。
如果税号清晰,可以通过税号去做?用一个小的数字识别模型,去识别印章中间区域。
mumbler
2025 年 5 月 13 日
多模态大模型一句 prompt 直接搞定,别自己搞算法了,时代过去了
PrinOrange2002
2025 年 5 月 13 日
yolee599
2025 年 5 月 13 日
分别提取特征点再计算他们之间的欧氏距离
paopjian
2025 年 5 月 14 日
训练一个检测模型, 专门找盖章的区域然后截取, 再用另一个模型提取印章的信息, 提取特征比较其他印章形状
原理类似人脸识别, 但是是否 ps 这玩意可不好判断, 一般是边缘突变什么的人工识别
jamos
2025 年 5 月 14 日
import imagehash
这个算法我用来查找视频中的重复片段,效果是很满意的。

Image: image1.jpg, Hash: 123456789abcdef0
Image: image2.jpg, Hash: 123456789abcdef1
Distance between image1.jpg and image2.jpg: 1
0d
2025 年 5 月 14 日
有个专门研究这个问题的领域叫 cvpr ,一般是梯度对比+欧氏距离
hmxxmh
2025 年 5 月 14 日
@yolee599
@tinytoadd
@paopjian 特征提取这个可以用哪个
l4mbda
2025 年 5 月 14 日
@hmxxmh #12 图像特征提取常用特征点类型可以考虑 sift ,superpoint 这种,匹配可以直接用算距离暴力匹配,或者用基于 AI 的方法,比如 superglue 这种
312ybj
2025 年 5 月 14 日
读取向量,算余弦相似度,都有现成的库。 不过你还要先扣图,这个就有点麻烦了
hmxxmh
2025 年 5 月 14 日
@312ybj 抠图我用 yolov8 训练了一版,主要是我不是算法出生的,不知道怎么提特征
hmxxmh
2025 年 5 月 14 日
@l4mbda 谢谢我学习一下
hmxxmh
2025 年 5 月 14 日
@mumbler 主要是资源不允许,而且多模态,只能提供最终是否一致的结果,像中间特征提取环节就不能暴露出接口出来
312ybj
2025 年 5 月 14 日
@hmxxmh 用 clip 模型的 Image Encoder , 这个能提取图片的特征
lyxxxh2
2025 年 5 月 14 日
对比好办,但是提取特征,应该没专门为印章训练的模型吧。
让 curosor 拿电商 行人的模型提取特征测试下?
(应该有更符合的模型 印章感觉挺好对比的 可能可以直接用)
Norsl
2025 年 5 月 14 日
需要自己训练个印章模型 然后提向量 对比余弦相似度,可以拿人脸模型的代码去训练一个 推荐 arcface

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1131503

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX