V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
wujunze
V2EX  ›  问与答

有什么好用的 OCR 识别工具?

  •  
  •   wujunze · 2016-11-30 15:22:26 +08:00 · 1759 次点击
    这是一个创建于 2707 天前的主题,其中的信息可能已经有所发展或是发生改变。
    1. 想识别一个图片里的字符 图片描述

    2.试了 github 上的一个开源包 https://github.com/netpi/baidu-ocr-api 识别准确率不高 图片描述

    3.请大家帮忙推荐好用的 OCR 识别包(php python node 的都行)
    谢谢

    12 条回复    2016-12-01 11:05:07 +08:00
    wujunze
        1
    wujunze  
    OP
       2016-11-30 15:30:11 +08:00
    Python 的 OCR 包应该有不少 有没有哪个童鞋用过的 求推荐
    tumbzzc
        2
    tumbzzc  
       2016-11-30 15:47:10 +08:00
    上面你说的开源包,用的其实是百度的 OCR ,我这边识别了一下,是同样的结果
    ynyounuo
        3
    ynyounuo  
       2016-11-30 15:49:33 +08:00
    你不会不知道 tesseract 吧 - -
    这玩意儿中文识别能力都另我意外啊
    tumbzzc
        4
    tumbzzc  
       2016-11-30 15:51:15 +08:00
    liangdi
        5
    liangdi  
       2016-11-30 15:55:50 +08:00
    默认配置的 tesseract 识别出来是 13998241747
    zhy0216
        6
    zhy0216  
       2016-11-30 16:03:03 +08:00
    colincat
        7
    colincat  
       2016-11-30 16:10:06 +08:00 via iPhone
    哈哈识别 58 同城
    wujunze
        8
    wujunze  
    OP
       2016-11-30 16:17:17 +08:00
    @liangdi 3Q 你用的是 py 版的 tesseract ? 可否发个 github 链接 搜了一下 出来很多 start 最多是 C++写的那个
    @ynyounuo 谢谢推荐
    @zhy0216 3Q 我试下
    liangdi
        9
    liangdi  
       2016-11-30 16:20:51 +08:00
    @wujunze 训练什么的 直接用 c++的 https://github.com/tesseract-ocr/tesseract
    找到了一个 py 的封装 https://github.com/madmaze/pytesseract 没有测试过
    wujunze
        10
    wujunze  
    OP
       2016-11-30 16:22:54 +08:00
    @liangdi 你刚才用默认配置的 tesseract 识别 用的是哪个?
    liangdi
        11
    liangdi  
       2016-11-30 16:27:52 +08:00
    @wujunze c++的 py 的也是调用 c++的呀
    wujunze
        12
    wujunze  
    OP
       2016-12-01 11:05:07 +08:00
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5670 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 03:04 · PVG 11:04 · LAX 20:04 · JFK 23:04
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.