郁闷,折腾了一周的爬虫

2024-08-26 17:50:07 +08:00
 guoguobaba

辛辛苦苦解码 js ,绕开反爬机制,结果他认证的时候加了个手机实名,我艸。

5955 次点击
所在节点    Python
28 条回复
llbqwhtxi
2024-08-27 02:11:27 +08:00
之前用 selenium 玩页游来的,最近一打开就被 403,要弃坑了(主要是不会"反爬")
incubus
2024-08-27 08:16:55 +08:00
@xinghusp 细说
Daybyedream
2024-08-27 08:50:38 +08:00
控制频率= = 不公开 是最后的温柔
linxb
2024-08-27 09:06:43 +08:00
@ospider #3 啊,这言论是什么立场,合着放开让你随便爬才是法治是吧
guoguobaba
2024-08-27 10:02:04 +08:00
@somebody1 我指的破解 js ,是屏蔽他对 selenium 之类自动化工具的检测。你去看看瑞数是怎么干的吧。
naythefirst01
2024-08-27 10:57:30 +08:00
想起之前一些 app 的反爬 就是强制登录。。。 简单有效
xinghusp
2024-08-27 19:06:12 +08:00
@incubus 改天我写个帖子详细的介绍,这事情一两句说不清。。反正就是爬虫的入罪门槛非常低,只要:1.你没明确得到对方同意(签协议的那种同意,公共网页也不可以); 2.你尝试绕过了任一反爬措施(包括但不限于验证码、代理、JS 混淆等等); 3 、获利大于 5000 元。达成上述三个条件,就可以追究刑事责任了,哪怕对方不报警。
duansindo
2024-08-31 22:02:06 +08:00
我这边需要抓取外国网站的数据,能做的联系我 https://t.me/githubaa

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1067921

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX