请教一个爬虫关于 HTTPS 请求的问题

2018-10-11 17:13:15 +08:00
 beforeuwait

笔者在 app 抓包的时候发现问题。

我用的 charles

比如抓包美团,手机配置代理后,美团就请求不到数据。

后来 google 后知道人家用了 ssl,这个证书在 charles 的 ca 里没有,所以通不过。

嗯,好吧,那就常规的 app,charles 可以抓包

我在写爬虫时候,根据抓包的 url cookie header 就可以去请求数据了。

这里我就突然困惑了,即使可以抓包,也是因为安装了 ca,而我在用 requests 库时候,并没有带任何证书,服务器仍旧会给我反馈,那么在爬虫层面 http 和 https 就没有区别了

这是为什么呢?

2479 次点击
所在节点    Python
3 条回复
beforeuwait
2018-10-11 17:24:52 +08:00
手动捂脸
刚刚我想明白了
平时我一直用的代理
偶尔用本地 ip 去请求是时候会 SSL 报错
requests 这个库去进行 https 请求也需要带 ca 的
liuyanjun0826
2018-10-11 19:17:49 +08:00
你好像对 hash 有所误解
warcraft1236
2018-10-11 19:41:40 +08:00
我觉得你应该先搞清楚 http 和 https,然后了解一下 MITM,然后了解一下 ssl pinning

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/496780

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX