关于用 Python 进行 ocr 识别的问题

2019-07-17 21:59:32 +08:00
 fang151liu

车门上有数字,用相机拍成图片,图片质量很差,想识别上面的数字, 用了 tesseract 效果不是很好, 想问下用 ctpn+crnn 可以识别嘛, 如果可以识别,要训练的话,图片要怎样处理

2741 次点击
所在节点    算法
8 条回复
registerrr
2019-07-17 22:34:16 +08:00
差到什么程度,人眼能识别出来吗?不如贴几张图上来,这个我见过有人帮训练的
jdhao
2019-07-17 22:40:46 +08:00
pixellink + crnn,只要图片数量够,效果应该不错的
fang151liu
2019-08-07 14:49:30 +08:00
fang151liu
2019-08-07 14:50:42 +08:00
@jdhao https://github.com/bear63/sceneReco 用了这个,10 个识别了 9 个,pixellink 比 ctpn 效果如何
jdhao
2019-08-07 16:59:23 +08:00
@fang151liu 比 ctpn 要好,ctpn 只能处理横排文字,pixellink 横排竖排检测都不错
fang151liu
2019-08-07 21:16:37 +08:00
@jdhao 那我现在纠结于是要改算法,还是要根据公司的图片自己训练模型,如果自己训练,应该是怎样的思路,谢谢
fang151liu
2019-08-07 21:17:28 +08:00
@jdhao 我一直以为是 crnn 的问题呢,因为是识别出错,多谢指教
fang151liu
2019-08-07 21:19:30 +08:00
@jdhao 我那个主要是横排和斜着的数字,不涉及竖排

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/583933

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX