网页自动化怎么攻克自动变化的验证码?

267 天前
 wty95

这个网站: https://www.jszwfw.gov.cn/jsjis/front/login.do?uuid=qvCwgZCSeRbz&gotoUrl=aHR0cDovL3h6endmdy5qc3p3ZncuZ292LmNuL3h6empjc21od3ovZXBvaW50empjcy9wYWdlcy9hZ2VudFNwYWNlX3NlcnZpY2Uvd2FpdEJpZGRpbmc%2FendkdHV1aWQ9ZGI4NmIzNzUtYjU4NS00MmY5LWE0MjktODI4NjUyMzE2MjA2

验证码 url 是固定的,但返回结果每次都变: https://www.jszwfw.gov.cn/jsjis/component/verifyCode.do?code=4&var=rand&width=162&height=55&random=0.34837298861771937

我目前是用自动化用 selenium ,识别 ocr 是腾讯云,请问怎么样才能实现 自动化填验证码?

5960 次点击
所在节点    程序员
51 条回复
shangfabao
266 天前
selenium +ocr,ocr 用的第三方库 搞过
wty95
266 天前
@seansong 各位老哥 我不是爬数据的,这个是政府公开中介超市,每天有项目可以报名,摇号中了就做业务,每天一堆报名,根本没精力手动填,所以想自动化报名。

请问这个也违法么?
zengxs
266 天前
@wty95 重点不是爬数据,而是你这种行为很容易把网站搞挂
gov 网站大多数本身就做的很垃圾,手动刷刷都有可能挂了,但是你手动刷的他也不能甩锅给你
如果是被你程序刷挂了,恭喜你喜提破坏计算机系统罪
xuhuanzy
266 天前
@wty95 他崩了只要查到是你的流量异常,你就百分百入狱。
lanten
266 天前
有趣的,看到 gov 就吓到腿软
GBdG6clg2Jy17ua5
266 天前
@lanten 有时候是百口难辨的。比如前几年的美国一位安全教授通过查看 html 页面获得几位老师的社保号码,被认为是黑客攻击。
securityCoding
266 天前
兄弟,有些内部的爬虫自动识别 gov.cn 关键词 return 掉。。。
yuchen198
266 天前
gov.cn 确实那啥最好别碰,我当时爬了药品监督局几万条数据,不过我那是一次性的,不是每天都要
seansong
266 天前
@wty95 你这个自动化报名,不就是典型的非法破坏和入侵计算机系统么,非常刑
akura
265 天前
先生大才
BBBOND
259 天前
https://www.gov.cn/zhengce/content/202409/content_6977766.htm
自 2025 年 1 月 1 日起施行

第十八条 网络数据处理者使用自动化工具访问、收集网络数据,应当评估对网络服务带来的影响,不得非法侵入他人网络,不得干扰网络服务正常运行。

第五十五条 违反本条例第十二条、第十六条至第二十条、第二十二条、第四十条第一款和第二款、第四十一条、第四十二条规定的,由网信、电信、公安等主管部门依据各自职责责令改正,给予警告,没收违法所得;拒不改正或者情节严重的,处 100 万元以下罚款,并可以责令暂停相关业务、停业整顿、吊销相关业务许可证或者吊销营业执照,对直接负责的主管人员和其他直接责任人员可以处 1 万元以上 10 万元以下罚款。

先生请自重

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1097616

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX