网页自动化怎么攻克自动变化的验证码?

2024 年 12 月 14 日
 wty95

这个网站: https://www.jszwfw.gov.cn/jsjis/front/login.do?uuid=qvCwgZCSeRbz&gotoUrl=aHR0cDovL3h6endmdy5qc3p3ZncuZ292LmNuL3h6empjc21od3ovZXBvaW50empjcy9wYWdlcy9hZ2VudFNwYWNlX3NlcnZpY2Uvd2FpdEJpZGRpbmc%2FendkdHV1aWQ9ZGI4NmIzNzUtYjU4NS00MmY5LWE0MjktODI4NjUyMzE2MjA2

验证码 url 是固定的,但返回结果每次都变: https://www.jszwfw.gov.cn/jsjis/component/verifyCode.do?code=4&var=rand&width=162&height=55&random=0.34837298861771937

我目前是用自动化用 selenium ,识别 ocr 是腾讯云,请问怎么样才能实现 自动化填验证码?

6862 次点击
所在节点    程序员
51 条回复
seansong
2024 年 12 月 15 日
很刑
Ct5T66PVR1bW7b2z
2024 年 12 月 15 日
ddddocr
nyxsonsleep
2024 年 12 月 15 日
直接买服务,根据难度,会比较贵。
破解验证码本身就能赚钱,技术含量也比爬虫高,甚至可能是里面技术含量最高的内容。
NoOneNoBody
2024 年 12 月 15 日
gov.cn ……这个不敢碰
adgfr32
2024 年 12 月 15 日
既然都 selenium 了,直接拿到页面图片文件送进 ocr 就行了,不用关心他怎么获取的。
顺便,gov.cn 域名,你最好别搞。
xuanbg
2024 年 12 月 15 日
V2 真是什么样的人才都有
dji38838c
2024 年 12 月 15 日
水平越初,胆子越大
klxyy
2024 年 12 月 15 日
GOV.CN 你也敢弄,果然很刑
Leofits
2024 年 12 月 15 日
很刑很可拷
hanssx
2024 年 12 月 15 日
兄弟,这个 uuid 要是根据客户端生成的,你有点自我暴露了就
csulyb
2024 年 12 月 15 日
你想想为啥人家要弄一下验证码? 本来可以不用弄验证码的,就是因为楼主这样的憨憨 进去太多了
shadowyue
2024 年 12 月 15 日
很刑,出来了给大家讲讲里边的生活
vevlins
2024 年 12 月 15 日
爬虫把政务网站搞挂被判刑的事你是没听说过?
huage
2024 年 12 月 15 日
肉身在国外随便搞,在国内老老实实。
fanhaipeng0403
2024 年 12 月 15 日
疯了吧你。
sir283
2024 年 12 月 15 日
一、找打码平台,租接口。
二、逆向网页 js ,尝试绕过对应逻辑,使其拿到对应的算法与出入参数,模拟 success 请求。类似中间人。
三、黑掉对方服务器,直接提取数据。
四、自己训练 ocr 模型。
五、放弃。
TArysiyehua
2024 年 12 月 15 日
提供技术咨询,有意联系
paopjian
2024 年 12 月 15 日
爬政府网?你在想什么呢
sampeng
2024 年 12 月 15 日
刚看完新闻,年底了进去一堆爬虫小子…我还想哪来二的猛人爬个网站把自己送进去。这不就看到,有哥们急着进去吃年夜饭。
gjw8u8
2024 年 12 月 15 日
这个牛逼

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1097616

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX