网页自动化怎么攻克自动变化的验证码?

264 天前
 wty95

这个网站: https://www.jszwfw.gov.cn/jsjis/front/login.do?uuid=qvCwgZCSeRbz&gotoUrl=aHR0cDovL3h6endmdy5qc3p3ZncuZ292LmNuL3h6empjc21od3ovZXBvaW50empjcy9wYWdlcy9hZ2VudFNwYWNlX3NlcnZpY2Uvd2FpdEJpZGRpbmc%2FendkdHV1aWQ9ZGI4NmIzNzUtYjU4NS00MmY5LWE0MjktODI4NjUyMzE2MjA2

验证码 url 是固定的,但返回结果每次都变: https://www.jszwfw.gov.cn/jsjis/component/verifyCode.do?code=4&var=rand&width=162&height=55&random=0.34837298861771937

我目前是用自动化用 selenium ,识别 ocr 是腾讯云,请问怎么样才能实现 自动化填验证码?

5943 次点击
所在节点    程序员
51 条回复
seansong
264 天前
很刑
Abbeyok
264 天前
ddddocr
nyxsonsleep
264 天前
直接买服务,根据难度,会比较贵。
破解验证码本身就能赚钱,技术含量也比爬虫高,甚至可能是里面技术含量最高的内容。
NoOneNoBody
264 天前
gov.cn ……这个不敢碰
z1829909
264 天前
既然都 selenium 了,直接拿到页面图片文件送进 ocr 就行了,不用关心他怎么获取的。
顺便,gov.cn 域名,你最好别搞。
xuanbg
264 天前
V2 真是什么样的人才都有
dji38838c
263 天前
水平越初,胆子越大
klxyy
263 天前
GOV.CN 你也敢弄,果然很刑
Leofits
263 天前
很刑很可拷
hanssx
263 天前
兄弟,这个 uuid 要是根据客户端生成的,你有点自我暴露了就
csulyb
263 天前
你想想为啥人家要弄一下验证码? 本来可以不用弄验证码的,就是因为楼主这样的憨憨 进去太多了
shadowyue
263 天前
很刑,出来了给大家讲讲里边的生活
vevlins
263 天前
爬虫把政务网站搞挂被判刑的事你是没听说过?
huage
263 天前
肉身在国外随便搞,在国内老老实实。
fanhaipeng0403
263 天前
疯了吧你。
sir283
263 天前
一、找打码平台,租接口。
二、逆向网页 js ,尝试绕过对应逻辑,使其拿到对应的算法与出入参数,模拟 success 请求。类似中间人。
三、黑掉对方服务器,直接提取数据。
四、自己训练 ocr 模型。
五、放弃。
TArysiyehua
263 天前
提供技术咨询,有意联系
paopjian
263 天前
爬政府网?你在想什么呢
sampeng
263 天前
刚看完新闻,年底了进去一堆爬虫小子…我还想哪来二的猛人爬个网站把自己送进去。这不就看到,有哥们急着进去吃年夜饭。
gjw8u8
263 天前
这个牛逼

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1097616

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX