请问匹配全文中所有两个 HTML 标签之间内容的 grep 正则表达式 怎么写?

2018-06-14 09:43:16 +08:00
 spencerqiu
>cat sample.txt
</span>
                                <span _content="">
那种写书不好好解释
动不动就留作习题

<div content="" class="sample" style="sample: 5px;">

</span>
                                <span _content="">
课后习题的答案除了最终结果什么都没有的作者
我真的很想踢爆你的头了……​​​

<div content="" class="sample" style="sample: 5px;">

期望匹配出:
那种写书不好好解释
动不动就留作习题

课后习题的答案除了最终结果什么都没有的作者
我真的很想踢爆你的头了……

*/即起始标签为带换行的两个标签</span>
                                <span _content="">
结束为 <div content="" class="sample" style="sample: 5px;">
*/

网上搜了一大堆都不管用,要么根本不行,要么换行不行 = =

2316 次点击
所在节点    正则表达式
9 条回复
grewer
2018-06-14 09:53:19 +08:00
var str = '</span> <span _content="">那种写书不好好解释动不动就留作习题<div content="" class="sample" style="sample: 5px;"></span> <span _content="">课后习题的答案除了最终结果什么都没有的作者我真的很想踢爆你的头了……​​​<div content="" class="sample" style="sample: 5px;">'
str.match(/>.*?</g)
spencerqiu
2018-06-14 10:13:02 +08:00
@grewer
是一整个 HTML,所以还有很多其他标签 = =
grewer
2018-06-14 10:19:25 +08:00
@spencerqiu 组件了解一下正则,然后写一个,不然想要契合你的需求是很难的
BOYPT
2018-06-14 10:26:18 +08:00
收费定制正则表达式
feibinyang
2018-06-14 10:35:09 +08:00
需求是获取所有文本节点吧,这用 DOM 操作遍历更方便吧
wplct
2018-06-14 10:50:59 +08:00
bs4 了解一下
rabbbit
2018-06-14 10:59:28 +08:00
另一种思路,不去匹配文字,把 html 符号全替换掉
https://imgur.com/a/sgT5mIJ
rabbbit
2018-06-14 10:59:39 +08:00
Alife
2018-06-14 11:30:24 +08:00
正则前将其变成一行

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/462971

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX