通过 PHP 或者其它语言如何快速判断字符串符合多个正则中某一条正则?

2022-11-12 23:07:38 +08:00
 cokar

比如我现在要判断用户输入的搜索词,如果输入的是 IP 我就直接返回 IP 归属地,输入运单号就直接显示物流信息,大概代码如下

if(isIP()){
   return 'IP 归属地';
}else if(isNum()){
   return '返回物流信息';
}else if(isDomain()){
   return '返回域名相关信息';
}

像这样的正则判断可能有几百上千条,并且逐渐增多,总之我想用户输入关键字搜索就直接响应对应的自定义内容。

但是一直 if else 判断感觉性能不行,如果正则越来越多肯定会更慢。 想请教各位大佬是否有更好的办法能更快速的判断呢?我主要使用 PHP 。

1832 次点击
所在节点    PHP
12 条回复
gstqc
2022-11-12 23:37:54 +08:00
正则必须匹配过才知道是否符合

技术上还是有一些方法的,比如 JIT
还有一个就是统计用户搜索频次,按数量调整正则顺序
learningman
2022-11-13 00:08:58 +08:00
你这等于是实现搜索引擎了,建议看看信息检索导论
wudicgi
2022-11-13 00:11:14 +08:00
正则有一个多模匹配就是做这个的,但不确定 PHP 里能不能用到
q1angch0u
2022-11-13 00:13:17 +08:00
策略模式可以实现开闭原则
sighforever
2022-11-13 00:15:57 +08:00
比较困难,这种估计没有普适的方案,只能自己研究一下现在的这些条件还有那些简单的特征可以分一下类,把复杂度变为 logn

另外话说回来,几千条正则匹配,没有那种极端情况,也不会很慢的,而且正则匹配是纯 CPU 操作,扩展性还是很好的
wudicgi
2022-11-13 00:27:39 +08:00
eason1874
2022-11-13 00:33:41 +08:00
PHP 正则匹配可以传入数组的, 一组匹配规则,对应一组处理函数,代码管理比 if 方便很多,效率有没提高就不知道了
skys215
2022-11-13 09:48:38 +08:00
运行一下正则,能匹配上的就是符合的正则
totoro52
2022-11-13 10:19:28 +08:00
你这个策略模式就能解决啊, 去看下策略模式就知道了 ,还有不判断怎么知道用户输入的是啥呢
silverwzw
2022-11-13 13:53:17 +08:00
Google 的 C++库实现了这个功能(具体是 RE2::Set ),PHP 里有没有对应的实现就不知道了。具体原理是把多个正则表达式编译成一整个大的 DFA 或者 NFA ,然后输入在这个 DFA/NFA 上跑一边,看看最后自动机停在哪里就知道对应匹配了哪一个 /哪几个表达式。如果你正则表达式多,而且重复的部分多,可以大大提升效率。
lietxia
2022-11-13 16:48:14 +08:00
判断交给前端 JS 。后端不做辨别。压力给到访问者就行了
cokar
2022-11-15 15:29:16 +08:00
感谢各位大佬的指导

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/894775

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX