爬虫的代理 IP 本地可用,部署到服务器上不可用

2019-02-24 22:16:30 +08:00
 luxid
一个简单的爬虫,二三十分钟爬一次一个美国网站固定页面的一个数值,无需登录,网站最近才加上的反爬,限制了同一 IP 请求的次数
代码里 header 信息齐全,网站必须美国 IP 请求,所以找了 100 个免费的美国高匿代理,user-agent 也搞了 10 多个,本地跑测试,IP 都可用,程序跑起来一切正常,跑 3 个小时一个 403 没有,但是部署到搬瓦工美国的服务器上,能有三分之一的代理 IP 请求报 403 Forbidden
我把报错的 IP 都存下来,放到本地跑,全部都可用,都能爬到数,然后再弄到服务器上,就是 403,有哪位遇到过这种情况吗,求帮助
python3.6 写的很直白简单的爬虫,搬瓦工洛杉矶的服务器
1343 次点击
所在节点    Python
1 条回复
hidder
2019-02-27 11:37:22 +08:00
在 vps 上试下代理 ip 的连通性

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/538258

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX