推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
KevinBu
V2EX  ›  Python

各位大佬,请教一下验证码去除干扰线和矫正的问题,有图了😭

  •  1
     
  •   KevinBu · Dec 19, 2018 · 3620 views
    This topic created in 2703 days ago, the information mentioned may be changed or developed.

    最近在用 Python 做爬虫,碰到了这种验证码(降噪 /二值化处理后的)

    现在想要将干扰线去掉,最好能矫正一下字符,不吝赐教。

    9 replies    2018-12-20 14:30:57 +08:00
    EvilCult
        1
    EvilCult  
       Dec 19, 2018
    这干扰线.......
    都跟字母的笔画一边粗了吧.......
    这可咋整....
    囧....
    zuoyouTU
        2
    zuoyouTU  
       Dec 19, 2018
    连续斜率?
    arrow8899
        3
    arrow8899  
       Dec 19, 2018
    这种只有切图了
    as9t
        4
    as9t  
       Dec 19, 2018
    深度训练
    jdhao
        5
    jdhao  
       Dec 20, 2018 via Android
    建议深度学习训练模型,样本的话可以自己生成,尽量拟合真实样本,效果应该不错。
    KevinBu
        6
    KevinBu  
    OP
       Dec 20, 2018
    @EvilCult 是阿,跟字母差不多粗,怎么去噪都去不掉
    KevinBu
        7
    KevinBu  
    OP
       Dec 20, 2018
    @jdhao 这样训练模型是不是要挺长时间的
    jdhao
        8
    jdhao  
       Dec 20, 2018 via Android
    @KevinBu 看你用 gpu 还是 cpu 训练,几十万样本,gpu 四五天可以跑完,cpu 就很慢了
    boom7
        9
    boom7  
       Dec 20, 2018 via Android
    前几天一个类似的验证码,搞了二十万数据,去腾讯云开了个 gpu 机器训练,两个小时跑完,最终测试的验证码通过率有九十多
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   1109 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 38ms · UTC 18:19 · PVG 02:19 · LAX 11:19 · JFK 14:19
    ♥ Do have faith in what you're doing.