Python ocr 识别

2018-05-28 09:41:09 +08:00
 RicardoScofileld

最近在研究图片文字识别,贵族老爷们有没有什么好使的库推荐一发啊,试着用了用 pytesseract,感觉识别效果太差了

5570 次点击
所在节点    Python
30 条回复
lonelygo
2018-05-28 16:32:30 +08:00
公网的话,用免费的 ocr 接口,不是特殊需求日常食用足以。
要内网使用,特殊的字符需求,数据集小的 [tesseract]( https://github.com/tesseract-ocr/tesseract) 3.05 训练好了。
数据集量够的话,可以看看深度学习的方法了:注意力+长短期记忆。
herozhang
2018-05-28 16:46:13 +08:00
tesseract-ocr
我这边用效果不错,据说 4.x 会更好。

有个前提,图片扔给 ocr 之前需要做一些预处理,例如裁剪、对齐、颜色调整什么的,这样识别率才 ok。
JCZ2MkKb5S8ZX9pq
2018-05-28 17:07:15 +08:00
之前搞直播答题外挂用的百度
RicardoScofileld
2018-05-28 17:19:40 +08:00
@herozhang 请问有具体的 demo 吗,我试着用 PIL 处理,有时候处理后的效果比处理之前的好,有时候处理之后反而更不好了
qianc1990
2018-05-28 17:23:10 +08:00
tesseract-ocr 0.4 的中文识别效果好点, 我之前做的时候采用 ctpn 算法从文章把文字一行一行抠出来, 在送去识别, 经验证百度的效果更好. [:捂脸]
chenuu
2018-05-28 17:41:40 +08:00
@RicardoScofileld 很便宜,月 1000 条免费,超出后每 1000 条 1.5 美元.效果不好说,没用过其他家的产品,除了手写的,其他的用谷歌很满意
dbow
2018-05-28 17:53:02 +08:00
tesseract-ocr 这东西需要你自己切图 + 标注, 对固定形态的文字其实效果还不错。
yanzixuan
2018-05-28 17:53:48 +08:00
现在不是用神经网络来玩吗? keras 的 example 了解一下?
hakaei
2018-05-28 22:06:36 +08:00
ctpn 可以很好的抠出横向排布的文字,接下来就是分词和识别的事了,但是 ctpn 对非水平文字效果不怎样,我最近也在研究 ocr 算法的问题,需求不能用 api (哎
RicardoScofileld
2018-05-29 09:33:21 +08:00
@hakaei 那就只能研究 tesseract 了,我试试对图片做一些预处理,再试试训练一下样本数据看看效果怎么样

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/458255

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX