首页   注册   登录
V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python 学习手册
Python Cookbook
Python 基础教程
Python Sites
PyPI - Python Package Index
http://www.simple-is-better.com/
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
V2EX  ›  Python

写了一个安居客的滑动验证码破解

  •  
  •   lanqing · 266 天前 · 4838 次点击
    这是一个创建于 266 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://github.com/clllanqing/slove_captcha/tree/master/anjuke

    欢迎 star,欢迎讨论

    我知道有没有其他好的方法,可以计算图片的移动距离和滑动轨迹

    31 回复  |  直到 2018-12-03 10:52:09 +08:00
        1
    404index   266 天前   ♥ 1
    要干坏事
        2
    lanqing   266 天前
    @404index 一直都在干坏事..
        3
    shell314   265 天前 via Android
    已 star
        4
    ClutchBear   265 天前
    已经 star
        5
    Variazioni   265 天前
    已 star
        6
    xxx749   265 天前 via Android
    这类不是基于 AI 和大数据来判断是不是机器人吗?滑块只是个采集方法吧?
        7
    CharlieBrown   265 天前
    已 star
        8
    lanqing   265 天前
    @xxx749 他们的后台的判断应该是基于大数据的
        9
    qwertty01   265 天前
    已 star
        10
    gzq527   265 天前
    666
        11
    hanssx   265 天前
    太 6 了
        12
    lanqing   265 天前
    @hanssx 什么技术都没用... 6 个锤子,只是想问问有没有更好的解决办法
        13
    ctro15547   265 天前
    看了一下这种图片挺友好,可以通过些手段在拼图边缘获取一些特征点,用特征点扫描图片,确定缺口位置相应的特征点坐标,滑动距离跟拼图和缺口距离在图片中的比例有关,剩下的交给 phantomJS 操作下就好
        14
    meiyoumingzi6   265 天前 via Android
    star 回头看。。。
        15
    Nimrod   265 天前 via Android
    repo 的名字是不是应该 solve …还是故意的
        16
    BBge   265 天前 via Android   ♥ 4
    我做过网易 腾讯还有极验的滑动验证码
    总得来说有三个测试点
    1 是滑块是否滑到正确位置
    2 是后台判断轨迹是否属于人工
    3 是同一设备连续大量地通过验证码之后会 ban 了你(我问了腾讯的员工得到的答案) 但我连续通过 1000 次腾讯滑动验证码没任何事
    滑块位置有好多方法能拿到 一是看能否穷举原图 然后做个像素异或就能得到滑块位置 二是拿 RCNN 训练个模型识别缺口 这种简单的图片识别起来很容易 丢个 500 张图片 准确率估计就 98%+
    移动轨迹可以用各种函数来加密分割 简单的匀加速匀减速容易被识别
    有兴趣可以看看这篇 paper
    Towards Understanding the Security of Deployed Image Captchas 欢迎引用
        17
    honeybeeRiding   265 天前 via iPhone
    用 Python 写的?
        18
    ihciah   265 天前
    移动距离我感觉可以直接回归出来,或者作为 detection 任务用 YOLO/Faster R-CNN(anchor 用一个就行了,大小根据实际调整)
    轨迹的话可以多录点数据用 GAN 做
        19
    lanqing   265 天前
    @Nimrod 四级没过 ,你觉得呢- ,-
        20
    lanqing   265 天前
    @BBge 受教了!但是我没有找到这个 paper.. 能贴一下么
        21
    Liang   264 天前
    学习了。求楼主搞个大众点评的~😂
        22
    wc110302   264 天前
    这类验证码应该也可以使用相同的处理方式吧
        23
    lanqing   264 天前
    这个是点击的不一样哦, 滑动的处理数据是 trace ,这个是点击的坐标, 内部处理的 js 或者加密方式估计是差不多的
        24
    lanqing   264 天前
        25
    wc110302   264 天前
    @lanqing 如果是这种文字点触验证码的话 那首先是不是也得将正确的文字坐标识别下来 也就类似于识别滑块验证码的缺口位置距离
        26
    lanqing   264 天前
    @wc110302 高级一点深度学习 简单点打码平台
        28
    BBge   264 天前
    @wc110302 这个简单的汉字点选验证码搞两个模型可以识别 一是汉字定位 用 RCNN 做 二是汉字识别 简单的搞个 CNN 模型就可以 现在识别率做到 90%+问题不大 时间花费大概一天 主要是自己做个数据集
    最简单的方法扔打码平台
        29
    Nick2VIPUser   263 天前
    请问代码中的`image.resize((284, 160))`这句,为什么需要 resize 到指定大小?
        30
    Nick2VIPUser   263 天前
    @Nick2VIPUser 看了下代码分析了一下明白了~原来是跟 html 上面图片窗口大小保持一致
        31
    brucedone   262 天前
    @wc110302 这个 so easy, 主要是自己标数据有点麻烦,你拆成两部分来着,1.文字的位置识别,detector 的框架就用 YOLO 模型了,我大概 500 张的图片,IoU 的准确率就很高了,2.画出框之后用现有的 OCR 免费的 API 训练就可以了,如果你想自己训练也是非常简单的。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   4175 人在线   最高记录 5043   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.3 · 19ms · UTC 02:18 · PVG 10:18 · LAX 19:18 · JFK 22:18
    ♥ Do have faith in what you're doing.