现在有什么开源项目 能识别图片中的文字的么?

2016-10-09 14:12:00 +08:00
 gamecreating

比如截图后 能识别图片中的所有文字 (当然文字都是规范的) 能识别到文字所在图片相对位置.

有什么开源的代码么? C/C++/python 都可

4868 次点击
所在节点    程序员
8 条回复
kenshinji
2016-10-09 18:11:14 +08:00
Pyteract?
slysly759
2016-10-09 19:00:44 +08:00
@kenshinji 好像拼错了吧⊙▽⊙
@题主 以前用汉皇还是一些 OCR 工具感觉除了拍照中书的字可以识别,其他手写啊倒着啊都不行
你这个需求有点小困难啊,先不说草书 行书 单是什么瘦金体 旋转 你就需要训练模型| ू•ૅω•́)ᵎᵎᵎ
现在流行的也不过识别验证码 或者图片归类什么的
你看百度这么大公司那个图片搜索做的啥德行你就明白了(⁄ ⁄•⁄ω⁄•⁄ ⁄)
reus
2016-10-09 19:26:46 +08:00
百度的 ocr 还可以,就是贵。这个东西如果做得好,赚钱很容易,不会轻易开源的
rogerchen
2016-10-09 22:49:54 +08:00
深度学习 again
sutra
2016-10-09 23:39:18 +08:00
tesseract
sigroma
2016-10-10 00:08:47 +08:00
你说的截图是指随便拍照,还是电脑上的截图

如果是第一种,这在 CV 上叫自然场景文字检测与识别( scene text localization and recognition ),是个挺难的问题,有个国际比赛 ICDAR 专注这方面问题,你可以看看这个比赛的历史论文,找作者要要源码
google 翻译里就有这个功能

如果是电脑截图,也可以利用这个方面的一些成果
文字定位可以使用 SWT 算法,这个算法实现简单,效果还不错, github 上能找到很多源代码
我比较推荐 ccv 这个库带的
http://libccv.org/doc/doc-swt/
文字的识别目前基本上就楼上提到的 tesseract 是能用的,如果你只限英文的话倒是还有些开源项目可选
likuku
2016-10-10 11:21:04 +08:00
隔壁也有个类似话题:
https://www.v2ex.com/t/311454
gamecreating
2016-10-11 09:54:02 +08:00
@sutra 现在用的这个 识别速度很慢.. 而且需要训练后 才识别率高..

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/311367

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX