Python 识别图片文字的效果是不是很差?

2021-12-06 00:34:34 +08:00
 zictos

试了一下 pytesseract 模块,好像很多文字都识别不了,只有一些纯色背景并且颜色反差比较大的才比较容易识别出来。
用百度的文字识别 api 接口大部分文字都能识别出来,效果挺好的,但有点担心图片内容的安全问题。
利用程序识别最多只能达到 pytesseract 模块这种程度的效果了吗?

10752 次点击
所在节点    Python
129 条回复
Windn0
2021-12-06 08:58:59 +08:00
楼上说的对,问出这个问题的确是楼主自己知识不足。基本的概念都不清楚。当然,也有可能是语文没学好。
ErenJaeger
2021-12-06 08:59:14 +08:00
tessract 需要训练才能提高识别度,基础的只能识别最简单的数字字符。稍微加个噪点或者调整倾斜度都会导致识别失败的。
Windn0
2021-12-06 08:59:54 +08:00
然后,回答楼主问题:随便去 GitHub 上找一个识别的项目自己整合啊,别告诉你只会调函数。
Jakarta
2021-12-06 09:00:31 +08:00
@ozuikai
提问的艺术
Python 有哪些好用的 OCR 模块 /算法 ❌
Python 的 OCR 是不是很差 ✅
MengQuadra
2021-12-06 09:05:29 +08:00
PaddleOCR 了解一下?
sunshijie
2021-12-06 09:08:59 +08:00
linnil
2021-12-06 09:09:40 +08:00
搜一下 trocr ?我想看看你是不是会说出 python 好牛逼,十行代码就实现了文字识别这样的话。
binux
2021-12-06 09:21:44 +08:00
@zictos 你还是没理解。就算某个语言,引擎,模型最终在文字识别 “效果好”,也不一定它的语言,引擎,模型就更好,它有可能训练数据更好,或者更贴近你的场景。如果你不理解 OCR 的技术原理,你都不知道你在找什么东西。

#14 楼已经告诉你了,如果你想要找一个直接开箱即用模块,对不起,没有。
AnsonUTF8
2021-12-06 09:28:58 +08:00
我感觉 OP 是误以为因为他说了 baidu 的挺好用的所以被喷,其实没有人关注你提不提 baidu ,都只是从技术的角度把你提到的 baidu api 当作 api ,没有代入对 baidu 的情绪。
Juszoe
2021-12-06 09:36:27 +08:00
如何制造热点帖子
Python 有哪些好用的 OCR 模块 /算法 ❌
Python 的 OCR 是不是很差 ✅
abersheeran
2021-12-06 09:39:34 +08:00
效果好的训练结果,人家都是拿来卖钱的好吧。你用的百度云的 API ,估计在他们服务端也是用 Python 去调用的。有免费的给你用就知足吧,还抱怨什么效果不好。
lostpg
2021-12-06 09:39:54 +08:00
@Jakarta
提问的艺术 ❌
吸引评论的艺术 ✔️
coolcatha
2021-12-06 09:40:01 +08:00
楼主不要这么激动,你提问的这个问题可能对非程序员来说很正常,如但是对程序员来说都会觉得比较可笑,没办法这个论坛大部分都是程序员,这些知识在这里算常识了。

如果你标题换成「 pytesseract 识别图片文字的效果是不是很差?」都挑不出任何问题。

不知道这些东西没关系,去了解就好了,在这里浪费时间不值得。
dlsflh
2021-12-06 09:40:33 +08:00
没有就没有,有就给个链接,非要抬杠显得自己专业楼主业余,长篇大论下来远不如直接回答问题。
dlsflh
2021-12-06 09:41:31 +08:00
另外,这个论坛可真不一定大部分是程序员。
xingshu1990
2021-12-06 09:42:38 +08:00
楼主问的是 牛头不对马嘴,22 楼的老哥已经说清楚。
把 Python 比作工具箱,pytesseract 或者其他 OCR 库,比作工具箱里的扳手等工具,难道扳手不好用,就说这个工具箱没用?

关于提高识别率,除了字体尽量统一以外,还要对图片进行裁切,图片去色,切片训练等处理,这中间又涉及到很多的算法,这些算法上面的老哥们都回复了。

开箱即用的软件的话,ABBYY 收费版+汉字训练 基本上能大量提高识别率。
zzl22100048
2021-12-06 09:46:13 +08:00
@coolcatha 你这样一改这贴没啥人回复了
jaredyam
2021-12-06 09:51:48 +08:00
我只说一句,文本检测和识别是当前 AI 领域的一个重要研究方向,不存在绝对的好与坏,你现在看到的大多是经典的、开源的、团队性质的。
ch2
2021-12-06 09:54:07 +08:00
tesseract 是上古算法,肯定比不上这几年才出的模型
你想效果好得自己用 pillow 预处理一下,不预处理没效果很正常
BQsummer
2021-12-06 09:59:25 +08:00
楼主跟真经回答 ppocr 的回答一个都不回复,就跟楼上的对线了,无语了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/820234

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX