数据采集遇到困难了

2020-05-24 08:47:34 +08:00
 cxy1234

目标网站是,后台返回接口,前端渲染。现在需要爬取 渲染后的样式及数据,除了用 selenium 还有啥其他办法么?

3003 次点击
所在节点    程序员
8 条回复
jugelizi
2020-05-24 08:48:46 +08:00
node
patx
2020-05-24 09:47:12 +08:00
无头浏览器 puppeteer
siknet
2020-05-24 11:01:12 +08:00
火车浏览器
gz911122
2020-05-24 11:05:46 +08:00
webview
yrj
2020-05-24 13:07:42 +08:00
要么渲染 js 要么根据数据自己渲染成指定样式结构
qinfensky
2020-05-24 15:02:13 +08:00
superagent + cheerio
wzwwzw
2020-05-24 17:24:45 +08:00
Splash.
ericls
2020-05-25 10:21:17 +08:00
puppeteer +1

如果是 python 可以用 request-html

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/674823

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX