如何利用Python 做验证码识别?同时求关于 识别验证码的一些资料

2013-06-30 09:31:43 +08:00
 pandada8
4351 次点击
所在节点    Python
7 条回复
mikawudi
2013-06-30 16:57:25 +08:00
和语言没啥关系,主要是看看图像处理方面的东西吧,验证码就不用做边缘检测了,简单的二值化处理下,然后分割一下,每个分割出来的数字(字母)的每个像素和标准的数字(字母)图像的每个像素点做异或运算,然后统计下和哪个标准数字(字母)图像的相似度最高,就是那个数字(字母)了....不过要考虑干扰噪点啊,干扰线啊什么的,然后如果生成验证码的时候用了旋转啊什么的那么就很难匹配了....我只用C#做过简单实验....不过思路大概就是这样的吧
pandada8
2013-07-02 20:08:35 +08:00
@mikawudi 有没有关于识别的资料呢,PDF书籍之类//算法渣求解救
andyhu
2013-07-02 20:52:59 +08:00
也可以直接deathbycaptcha人力解决
pandada8
2013-07-02 21:07:20 +08:00
@andyhu 太狂野了……只是自己用的一个小脚本而已
ufo22940268
2013-07-03 08:18:02 +08:00
justin1989
2013-07-03 09:25:17 +08:00
验证码里如果有扭曲和重叠,程序就基本搞不定了
VYSE
2013-07-03 09:40:28 +08:00
试过tesseract这类OCR,对验证码基本无解,除非针对某类特殊优化

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/74185

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX