表格布局的页面怎么样爬取比较简单呢

2020-02-27 16:01:40 +08:00
 dangod0

页面比较老了 有海量的 td 和 tr 标签 想请教一下不知道有没有什么比较方便的方法

1178 次点击
所在节点    问与答
7 条回复
Soundtrack9407
2020-02-27 16:23:24 +08:00
试试 Excel,数据->自网站
ThirdFlame
2020-02-27 16:27:57 +08:00
python requests-html 1、find table 2、find tr 3、find td
dangod0
2020-02-27 16:41:52 +08:00
@Soundtrack9407 需要登录的。。 能带 cookie 吗
dangod0
2020-02-27 16:42:52 +08:00
@ThirdFlame 感觉比较麻烦 还是谢谢回复
ThirdFlame
2020-02-27 16:57:00 +08:00
10 行代码就能搞定,还觉得麻烦,那我是没有了。
直接复制 粘贴吧
Soundtrack9407
2020-02-27 17:09:20 +08:00
@dangod0 类似网页截图,有页面可看,登录后选取抓取对象
dangod0
2020-02-27 17:13:57 +08:00
谢谢 用 pandas 解决了(~ ̄▽ ̄)~

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/648082

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX