PHP 如何将 html 文件解析成 dom 树?

2018-06-07 23:29:41 +08:00
 PHPer233
有一个 html 文件,为了提取文件里的某些内容,我一般是利用正则表达式,但这样做太累了,提取不同的内容要写很多正则表达式。我想把 html 文件解析成 dom 树,这样就方便提取任意元素的内容了。不知道 php 有没有方便的途径实现这样的功能?
2925 次点击
所在节点    PHP
10 条回复
yangqi
2018-06-07 23:32:46 +08:00
直接用 DOMDocument 啊
SoulGem
2018-06-07 23:38:24 +08:00
PHPer233
2018-06-07 23:42:38 +08:00
@yangqi 感谢提示,我一直没有注意到这个扩展。
Herobs
2018-06-08 00:02:56 +08:00
xpath 了解一下
anewg
2018-06-08 09:01:44 +08:00
symfony 的 DomCrawler 组件,总之别用正则。。。
jingrui
2018-06-08 09:18:39 +08:00
phpquery 了解下
zarte
2018-06-08 09:52:31 +08:00
xpath,chrome 右键就可以得到公式,你应该是弄爬虫吧,注意下 js 渲染的网页你也要渲染下再提取,要不然复制出来的公式会取不到东西。
VgV
2018-06-08 10:42:41 +08:00
@zarte 怎么渲染再提取?
zarte
2018-06-08 11:41:55 +08:00
@VgV phantomjs 或者看网页源码手动写公式
han8gui
2018-06-08 16:20:15 +08:00
phpquery 啊,或者有个开源工具 querylist

python 建议使用 xpath

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/461352

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX