新手求教, python 使用 multiprocessing 进行多进程爬取网站,如何实现登录 session 的共享

2016-09-22 15:14:05 +08:00
 killvoon
网站需要登录,单个进程爬取的话没有问题,但多进程爬取的时候,就会出现没有登录的情况
2450 次点击
所在节点    Python
7 条回复
264768502
2016-09-22 18:38:37 +08:00
io 密集请用异步或者多线程
为什么用多进程?
superalsrk
2016-09-22 21:03:56 +08:00
请换成 subprocess
superalsrk
2016-09-22 21:05:25 +08:00
额。。说错。。。
TaMud
2016-09-22 21:14:45 +08:00
CURL + COOKIE FILE
iyaozhen
2016-09-22 21:17:04 +08:00
Python 的这个多进程没有多线程好用
xingzhi
2016-09-23 02:02:26 +08:00
不管是多进程还是多线程,确保只登录一次,共享同一个 Cookies 就好了。
reself
2016-09-23 14:23:29 +08:00
cookie file ,或者 key-value 数据库例如 Redis 什么的

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/308167

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX