scrapy 反爬问题

2021-11-29 12:46:59 +08:00
 CaptainD

我用 scrapy 写了一个爬虫,爬一些国外公共网站的内容,之前工作正常,但这周一发现页面返回内容出错,状态码是 200 ,但是返回的内容是错误的,怀疑是爬虫被识别了

这类的公共网站一般没有什么反爬,之前做的反爬手段只有模拟浏览器头,设置一下 delay 之类的,没有使用代理,这种可以确定是反爬手段吗,大家有什么好的解决方式吗

748 次点击
所在节点    问与答
2 条回复
xiao109
2021-11-29 13:14:18 +08:00
那就上代理呗,反正反爬和反反爬大家来来回回也就那三板斧
CaptainD
2021-11-29 13:45:59 +08:00
@xiao109 代理也不是没用过,免费的不好用,收费的有点贵

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/818708

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX