GirlCrawler - 简洁、高效的煎蛋妹子图

2017 年 8 月 17 日

ericlong233

注意：适当撸妹益脑，过度撸妹伤身。请在遵守当地法律法规的前提下使用。煎蛋网资源有限，请适当使用。
原来的帖子 t/383493 由于本人的操作失误被放入无要点，已提交管理删除

GirlCrawler 是一个简洁、高效的煎蛋妹子图爬虫。它基于高效、异步的 Node.js 。具有以下特性：

快速，由 Node.js 的异步 I/O 提供支持
基于 OO/XX 的过滤器
友好的 CLI 界面
根据 MD5 自动过滤失效照片

安装方法：npm install girlcrawler -g 注意 -g

Github repo: Ericlong233/girlcrawler
npm repo: girlcrawler

4580 次点击

所在节点

分享创造

8 条回复

a570295535

2017 年 8 月 18 日

除了新手练练手玩玩，爬这些毫无撸点的图有个卵用啊

whileFalse

2017 年 8 月 18 日

Running crawler with arguments: thread=64, filter="oo > xx"
** F I N I S H E D ! **

为啥目录下啥也没有呢。

ericlong233

2017 年 8 月 18 日

@whileFalse 截个图发到 issues 里如何?我来处理

ericlong233

2017 年 8 月 18 日

@a570295535 有撸点的可以去 tumblr 和 pornhub

silencefent

2017 年 8 月 18 日

请不要在煎蛋使用爬虫

ericlong233

2017 年 8 月 18 日

@silencefent 照你这样说，所有的搜索引擎都找不到煎蛋，所有的第三方（以及可能的第一方）客户端都不能使用。
图片是微博的，爬虫不会执行 JS，也就是说，爬虫只会爬取页面的源码和微博的图片，不会爬其他的东西。一页煎蛋妹子图的源码大约 80~100KB。
我现在能做的是，尽量把爬虫对煎蛋的影响降到最低，这点可以从我的源码里看出来。

ericlong233

2017 年 8 月 18 日

@silencefent btw，如果 sein 他们再次放出捐赠链接的话，我会考虑捐赠。

Trim21

2017 年 8 月 19 日

看了下 robots.txt /ooxx 是可以爬的吧

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/383798

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.