在写爬虫,请问 https 的网站能爬嘛?

2015-07-02 16:14:06 +08:00
 fghfjujiber

应该是可以的吧?还有啥叫分布式爬虫呢?

6283 次点击
所在节点    问与答
6 条回复
Septembers
2015-07-02 16:15:49 +08:00
可以
CC @binux
kenneth
2015-07-02 16:24:19 +08:00
分布式就是不是单机的用法,多机器的来爬。这样就Elastic。
learnshare
2015-07-02 16:26:48 +08:00
对网页内容来说,HTTP 和 HTTPS 并无差异
imlonghao
2015-07-02 16:35:06 +08:00
sivacohan
2015-07-02 20:53:59 +08:00
你的爬虫支持ssl就行,如果你用requests。
那http和https没什么区别。当然python2可能会踩到ssl的坑,可以通过patch来解决。
julyclyde
2015-07-02 20:56:32 +08:00
为什么会有这种问题

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/202812

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX