求一个正则表达式,获取不是标准的 url 的字段...

2020-01-31 16:43:37 +08:00
 uti6770werty

如:

'<img align="absmiddle" src="/cache/images/img/67728.jpg"/>'
'<img align="absmiddle" src="/cache/images/img/clound.png"/>'
'<img align="absmiddle" src="/cache/images/img/sky.gif"/>'

获取 67728,clound,sky 字段,
网上找到的例子都是根据标准的 http://开头的,一开始自己拿改来改去 work 得不正常...
后来自己写了个逐层剥离找出字段的,能 work,但是量大就略显速度上不来,想看看正则的姿势看看效率怎么样的...

1184 次点击
所在节点    问与答
5 条回复
ysc3839
2020-01-31 16:58:27 +08:00
如果数据都是这样工整的话
\/([^\/]+?)\..+"

否则还是建议解析 xml 然后文本搜索。
sneezry
2020-01-31 17:13:58 +08:00
/src=".*?\/(.*?)\.[^\.]+"/ 试一下这个
xycool
2020-01-31 17:23:43 +08:00
src\s*=\s*"(.+?)"
2wex
2020-01-31 17:24:15 +08:00
如果 img 是固定的,对 img 反向肯定预查可以吗

(?<=img\/)[\w\.]+"
autoxbc
2020-01-31 19:12:21 +08:00
有现成的轮子(DOMParser & URI.js)可以解析,自己写正则是埋 bug

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/641214

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX