关于用 Python 进行 ocr 识别的问题

2019-07-17 21:59:32 +08:00

fang151liu

车门上有数字，用相机拍成图片，图片质量很差，想识别上面的数字，用了 tesseract 效果不是很好，想问下用 ctpn+crnn 可以识别嘛，如果可以识别，要训练的话，图片要怎样处理

3265 次点击

所在节点

8 条回复

registerrr

2019-07-17 22:34:16 +08:00

差到什么程度，人眼能识别出来吗？不如贴几张图上来，这个我见过有人帮训练的

jdhao

2019-07-17 22:40:46 +08:00

pixellink + crnn，只要图片数量够，效果应该不错的

fang151liu

2019-08-07 14:49:30 +08:00

fang151liu

2019-08-07 14:50:42 +08:00

@jdhao https://github.com/bear63/sceneReco 用了这个，10 个识别了 9 个，pixellink 比 ctpn 效果如何

jdhao

2019-08-07 16:59:23 +08:00

@fang151liu 比 ctpn 要好，ctpn 只能处理横排文字，pixellink 横排竖排检测都不错

fang151liu

2019-08-07 21:16:37 +08:00

@jdhao 那我现在纠结于是要改算法，还是要根据公司的图片自己训练模型，如果自己训练，应该是怎样的思路，谢谢

fang151liu

2019-08-07 21:17:28 +08:00

@jdhao 我一直以为是 crnn 的问题呢，因为是识别出错，多谢指教

fang151liu

2019-08-07 21:19:30 +08:00

@jdhao 我那个主要是横排和斜着的数字，不涉及竖排

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.