有什么好用的 OCR 识别工具?

2016-11-30 15:22:26 +08:00
 wujunze
  1. 想识别一个图片里的字符

2.试了 github 上的一个开源包 https://github.com/netpi/baidu-ocr-api 识别准确率不高

3.请大家帮忙推荐好用的 OCR 识别包(php python node 的都行)
谢谢

1766 次点击
所在节点    问与答
12 条回复
wujunze
2016-11-30 15:30:11 +08:00
Python 的 OCR 包应该有不少 有没有哪个童鞋用过的 求推荐
tumbzzc
2016-11-30 15:47:10 +08:00
上面你说的开源包,用的其实是百度的 OCR ,我这边识别了一下,是同样的结果
ynyounuo
2016-11-30 15:49:33 +08:00
你不会不知道 tesseract 吧 - -
这玩意儿中文识别能力都另我意外啊
tumbzzc
2016-11-30 15:51:15 +08:00
liangdi
2016-11-30 15:55:50 +08:00
默认配置的 tesseract 识别出来是 13998241747
zhy0216
2016-11-30 16:03:03 +08:00
colincat
2016-11-30 16:10:06 +08:00
哈哈识别 58 同城
wujunze
2016-11-30 16:17:17 +08:00
@liangdi 3Q 你用的是 py 版的 tesseract ? 可否发个 github 链接 搜了一下 出来很多 start 最多是 C++写的那个
@ynyounuo 谢谢推荐
@zhy0216 3Q 我试下
liangdi
2016-11-30 16:20:51 +08:00
@wujunze 训练什么的 直接用 c++的 https://github.com/tesseract-ocr/tesseract
找到了一个 py 的封装 https://github.com/madmaze/pytesseract 没有测试过
wujunze
2016-11-30 16:22:54 +08:00
@liangdi 你刚才用默认配置的 tesseract 识别 用的是哪个?
liangdi
2016-11-30 16:27:52 +08:00
@wujunze c++的 py 的也是调用 c++的呀
wujunze
2016-12-01 11:05:07 +08:00

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/324354

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX