图片爬虫 laosj(老司机),支持分布式,可以自定义下载并发量

2016-12-07 18:38:16 +08:00
 spice630

最近在做鉴黄方面的东西,自己写了个图片爬虫爬点图。

功能不算强大,但是非常轻量 好用,临时需要爬些数据是极好的。

有现成的示例,编译完可用。

https://github.com/songtianyi/laosj

3148 次点击
所在节点    问与答
5 条回复
ofblyt
2016-12-08 08:20:09 +08:00
能说一下怎么支持分布式的么?
spice630
2016-12-08 10:58:21 +08:00
@ofblyt
redis, 采集 url 放入 redis ,下载器从 redis 取 url 。
spice630
2016-12-08 11:00:35 +08:00
@ofblyt
分布式爬取的话,目前并没有很好地支持(因为自己目前还用不上),需要自己写任务分发。
spice630
2016-12-08 11:01:14 +08:00
@ofblyt 多机部署 /运行是没问题的。
spice630
2017-02-13 14:43:25 +08:00
新加内容:
aiss-darwin 根据接口下载爱丝图片(依赖 redis 作为 url 队列)
jav 获取番号列表及根据番号获取种子文件 (无依赖)
haixiuzu.go 豆瓣害羞组图片抓取和下载(依赖 redis 作为 url 队列)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/325993

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX