首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
V2EX  ›  问与答

如何自建以图搜图?

  •  
  •   t1518968889 · 2017-10-11 18:14:24 +08:00 · 1964 次点击
    这是一个创建于 787 天前的主题,其中的信息可能已经有所发展或是发生改变。

    可能我搜索关键词用不准,但我找了多次,完全没头绪. 像谷歌识图那样,提交图片,然后返回相似的图片. 电脑上图片太多,用去重软件每次都要扫描很久,1 万张图差不多就要 1 小时左右,无法想象 10 万张图时的工作量. 有这方面现成的"搜索引擎"么?

    第 1 条附言  ·  2017-10-11 18:53:06 +08:00
    我说的直白点吧.
    这有一个例子 http://konachan.com/post/similar
    他应该是索引了他拥有的所有图片的指纹,然后我提交 /上传一张图片,他就返回他拥有的图片里是否存在相似的图片给我,我就想弄一个这样的功能,方便自己查重,也提供这个服务给浏览者,绝不是简单的查找重复图片,不管速度多快,像我说的查重软件和 @azh7138m 给的链接,应该都是需要先扫描所有图片一次,下次查重时又要扫,很费时间,并且这也不是重点,重点是,我想弄一个这样的网页服务,而不是桌面程序什么的.
    6 回复  |  直到 2017-10-12 00:19:59 +08:00
        2
    lizhijun   2017-10-11 18:40:59 +08:00   ♥ 3
    刚好最近在研究这个。写个程序生成图片的 phash 指纹,然后算两张图片指纹 phash 的汉明距离,如果这个汉明距离小于 5 说明这两张图片非常相似。附获取图片 phash 指纹的代码:
    ```python

    from PIL import Image
    import imagehash
    import sys

    img = Image.open('./images/1.jpg')
    print imagehash.phash(img)

    ```
        3
    qiayue   2017-10-11 18:43:28 +08:00
    搜索引擎也要先索引你电脑上的所有图片啊
        4
    weifding   2017-10-11 18:45:09 +08:00 via Android   ♥ 1
    用特征的,你可以搜索下 surf 和 sift 算法。算法还好,速度才是最大问题。整套系统我以前建过。代码量不大,要设计的很巧妙才行。
        5
    weifding   2017-10-11 21:02:57 +08:00 via Android
    桌面还是 web 服务,核心都是一样啊。我前面回复提示的够明显了吧。。
        6
    t1518968889   2017-10-12 00:19:59 +08:00 via Android
    @weifding 够明显了~不过我还在找有没有现成的开源工具什么的,造轮子心累。。。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2351 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 23ms · UTC 13:51 · PVG 21:51 · LAX 05:51 · JFK 08:51
    ♥ Do have faith in what you're doing.