有没有爬虫管理开源项目,可以管理爬虫脚本、ip 代理池、数据可视化

241 天前
 nunet

有时候写了一些爬虫脚本,但都是单文件的,每次都要指定好数据库字段,然后运行爬虫爬取数据。 我就在想,有没有可以管理爬虫脚本的项目,支持将爬虫脚本编辑和运行,支持预览爬取的数据,可以配置 ip 代理池。我在 github 上找了一下,没有找到。自己开发的话,感觉是个大工程。

2725 次点击
所在节点    Python
5 条回复
bqzzd
241 天前
crawlab 、scrapyweb
suckinbottle
241 天前
这种带有自定义的功能,建议是自己开发一个。另外,建议将脚本集成到框架中去管理,这样就更加方便。
xixiv5
241 天前
代理池有推荐的吗
yb8Qes1Qae01H0xy
241 天前
用 scrapy 开发了一些脚本,比较稳定
scrapyweb ,用过一段时间,bug 很多 ,现在用 crontab 调用 scrapy ,稳的一笔
macaodoll
214 天前
我都是自己开发,

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1114256

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX