Aragog - 基于 AMQP 的分布式双模式爬虫框架 (Node.js)

2020-06-20 17:12:35 +08:00
 wst

因为平时经常写一些和爬虫相关的小项目,受 RabbitMQ 的启发,我将爬虫核心的部分单独做了一个项目。结合 RabbitMQ 后可以只部署一套爬虫服务,供各种其他服务使用,即节约了系统资源,又可以统一管理。

Aragog 分为服务端,客户端和 RabbitMQ 服务。多个服务端和多个客户端通过 AMQP 协议连接到 RabbitMQ 服务。系统扩展性很好,目前只做了一些基础的功能,欢迎试用和提 issue 。

这是我第一个真正意义上的开源项目,顺便求个星星鼓励下😁

服务端: https://github.com/crawlerlab/aragog

客户端: https://www.npmjs.com/package/aragog-client

特性

1602 次点击
所在节点    分享创造
1 条回复
solaro
2020-06-29 17:58:16 +08:00
能把 poxxhub 加入 爬虫吗?

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/683324

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX