现在爬虫技术中如果遇到需要登录才能访问的接口,都是如何处理的?

2022-11-18 11:13:58 +08:00
 sun1993

如题,比如 web 端,有些需要登录才能访问的资源,我能想到的访问方式就是将用户的 Cookie 全部写入请求头,而 Cookie 又需要用户自己登录才能获得,如果登录允许无限重试,密码可以用穷举法破解掉,但现在一般网站重试次数有限,而且大都配备了先进的验证码,这个方式就基本上废掉了,移动端也是类似的局面,那么现在的爬虫技术如何破解这种局面呢?

546 次点击
所在节点    问与答
2 条回复
Eiden
2022-11-18 11:19:31 +08:00
这不是盗号吗
wellCh4n
2022-11-18 13:29:14 +08:00
需要登录 => 注册一个号
字母验证码 => OCR
滑块验证码=> 机器视觉 + selenium
更先进验证码 => 打码平台

穷举破解密码可刑,不可取

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/896162

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX