腾讯漫画爬虫........

2017-04-20 09:45:35 +08:00
 justtery

上周周末写了一个腾讯漫画的爬虫....

现在已经有的功能:

1.查找漫画

2.查找出漫画的总章节数目

3.下载单话漫画

4.下载所有章节漫画(免费的括号笑)

目前存在的问题:

1.多线程下存在卡死或假死的状态(这块我是真的搞不懂了)

跪求大佬们教育,为什么会出现多线程下爬虫不爬了的情况啊 昨天我加了请求超时时间也还是会出现这种状况(昨天的修改没有上传 github)

代码地址:https://github.com/Fretice/Tencent_Cartoon_Download

注:请忽略 readme 文件中的内容,因为好多都写错了 /(ㄒoㄒ)/~~

5397 次点击
所在节点    分享创造
26 条回复
xuyl
2017-04-20 23:38:09 +08:00
这种打包方式确实奇葩,你搞个 requirements.txt 不就行了?
visylar
2017-04-20 23:49:43 +08:00
pic_list_download 作为一个 shared variable 传入 13 个线程如果没有注意 atomic access ,应该会有很多 race condition ,所以会卡死或假死
RqPS6rhmP3Nyn3Tm
2017-04-21 04:34:34 +08:00
我当年也写过一个差不多的,不过你这打包方式真的奇特
justtery
2017-04-21 08:12:42 +08:00
@visylar 大佬能不能详细的给小弟讲一下
MyFaith
2017-04-21 08:55:06 +08:00
看了一眼 venv 目录,还是不 star 了。
Ixizi
2017-04-21 10:09:32 +08:00
hhhhhhhh 厉害了 我的哥

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/356069

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX