关于 pyspider 源码中 splash 的问题

2019-01-14 10:52:18 +08:00
 foxyier
最近在学习 pyspider 的源码,发现抓取数据时的参数可配置为 splash ( fetch_type="splash"), 而且也有专门的 splash_fetch 函数和 splash_fetcher.lua 脚本来运行启动 splash,可是在网上找不到相关资料, 由于现在 phantomjs 项目已经基本被弃用了, 请问这个 splash 可以在编写爬虫时直接使用么?求解
1808 次点击
所在节点    Python
3 条回复
knightdf
2019-01-14 10:57:53 +08:00
splash 是个单独的项目,自己去它官网看吧,渲染 JS 的
可以直接使用的,pyspider 没用过
foxyier
2019-01-14 11:00:16 +08:00
@knightdf splash 之前用过, scrapy 也自带插件, 最近在学 pyspider,只是好奇源码中很久之前就有相关代码, 但在网上找不到相关资料。
xanthu
2019-01-14 11:09:31 +08:00
splash 不是一个服务么?应该要配置一下才能用吧,pyspider 没用过,但我用 scrapy 是挂了个 docker 跑的,有需要 js 渲染的就通过 splash 访问

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/526786

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX