高德地图爬取频繁出现滑块验证,怎么通过底层发送请求破解?

2018-11-21 14:45:55 +08:00
 louhang

在爬取高德地图过程中时间长会出现一个滑块验证的验证码,需通过之后才能获取后续内容,现在已经找到了他要发送的请求以及各个参数,但是就差一个加密参数搞不定,前台 js 打断点进入之后通过 console 跑出来的加密参数放到请求中可以返回正确结果,拿该文件到 python 跑出来的加密参数放到请求中返回的结果就不正常了,各位大佬有这样去解过高德的验证码的吗?

我知道高德有一个开放者平台但是每天的 poi 调用量不是太多。

为什么在 V2EX 上创建的帖子不能放图片呀,这纯文本谁能看懂啊!!!!!

4037 次点击
所在节点    Python
1 条回复
lanqing
2018-11-22 10:33:33 +08:00
我以前爬过 58,破解过滑动验证码,我所理解的滑动验证码,其实就是你滑动鼠标的时候,js 会生成一个数组数据,然后将数组数据连起来加密.
我的破解流程是,我滑动了 340 次,生成了所有的路径数组,他的 js 加密过程用的是一个算法(a 什么的?我忘了),我用 node.js 模拟了他的加密过程,以后每次出现个滑动图片的时候,调用对应的路径数组就可以了

这里面其实有个坑点,我觉得可以解释你为什么拿出来就不正常的原因, 你拿出来的加密数据是一个路径数组,你第一次可以是因为他是你滑动出来的,当你第二次再用这个数据,后台会发现他跟上个路径一模一样,会认为你是爬虫,我当时的做法是稍稍稍微调整了一下路径数组,让后提交,就成功了.

以上只是我的破解经验,提供你参考下

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/510025

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX