有什么类似 Web Scraper 的爬虫插件么,支持批量 url 抓取数据的。

2020-07-28 20:44:14 +08:00
 across
没做过爬虫,需求是这样的:
20+个网页,每个网页里面有几十个数据条目。
设定好规则抓取数据, 希望每天开机时自动跑一遍收集下数据就可以了,不限工具。Web Scraper 的 Sitemap Json 不支持批量 URL 导入,20+个网页挨个点还是麻烦····

之前查了下 Puppeteer 很好上手,不过跑了下,触发反爬机制了(里面有几个网页是电商的=_=)。
2058 次点击
所在节点    问与答
3 条回复
ila
2020-07-28 20:47:09 +08:00
加钱,楼下帮你搞定
locoz
2020-07-28 21:13:05 +08:00
八爪鱼,下一个
siknet
2020-07-28 22:29:24 +08:00
火车浏览器 /火车采集器

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/693857

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX