webmagic 爬 58 同城久了会触发验证码反爬

2019-05-24 08:57:43 +08:00
 h8743

https://callback.58.com/firewall/verifycode?serialId=d22d6f319b5148ae8a199a4b574dd8b4_7daf4f969cac4852a2fbbfb2e275bbcd&code=22&sign=26dbf4d672a5d9691e63e40bb02910d0&namespace=ershoufanglistphp&url=https%3A%2F%2Fwh.58.com%2Fershoufang%2F&tdsourcetag=s_pcqq_aiomsg&qq-pf-to=pcqq.group

怎么解决 啊

3167 次点击
所在节点    程序员
3 条回复
murmur
2019-05-24 09:10:43 +08:00
手打验证码
有打码平台的
silencefent
2019-05-24 09:38:30 +08:00
难,建议分布式多账号 ip 池
tikazyq
2019-05-24 10:27:45 +08:00
最好用 ip 池来抓取,而且要注意 robots 协议。稍微高级一点自己用神经网络破解验证码也可以,但是比较麻烦。

顺便安利一下开源爬虫平台 Crawlab,https://github.com/tikazyq/crawlab,兼容各大爬虫框架,包括 scrapy、webmagic、puppeteer、selenium

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/567157

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX