有没有支持简单的逻辑 运算的文本搜索引擎, 或者相关的技术方案

2020-12-18 17:08:35 +08:00
 xchaoinfo

判断一个如下类型的逻辑关键词, 是否在文本里面

a and b,
a or b,
a and b and c and d,
a or b or c or d,
(a and b) or (c and d)
(a or b) and (c or d)

and or () 三种运算逻辑,

目前通过 Python 正则和递归实现了一个简单的版本, 基本思路是, 先把逻辑运算解析为 关键词的列表, 然后在判断是否在 文本 里, 例如, (a and b) or (c and d) 解析为 [(a, b), (c,d)]

a or b or (c and d) 解析为 [(a,), (b,), (c,d)]

然后迭代通过 in 操作来判断

目前代码的状态是 shit but work well, 请问各位大佬, 有好的解决方案吗?

1248 次点击
所在节点    程序员
8 条回复
lxml
2020-12-18 17:12:50 +08:00
两周自制脚本语言
HarveyTvT
2020-12-18 17:23:11 +08:00
grep OR
grep -E 'pattern1|pattern2' filename

grep AND
grep -E 'pattern1' filename | grep -E 'pattern2'
xchaoinfo
2020-12-18 18:01:16 +08:00
@HarveyTvT grep 无法解决 and or 的混合匹配, 以及 () 的优先级的匹配
oott123
2020-12-18 18:33:27 +08:00
autoxbc
2020-12-18 18:47:59 +08:00
用编程语言原样实现不就好了,为什么还要搞成一个「引擎」?用这个引擎的人还要学一下描述这个引擎输入的 DSL,那直接用高级语言作为 DSL,去掉引擎不好么
xchaoinfo
2020-12-18 19:12:53 +08:00
@autoxbc 目前就是用正则和递归, 徒手写的, 代码写的非常 shit, 主要想看看有没有更好的方案
lzxz1234
2020-12-18 19:17:53 +08:00
black11black
2020-12-18 19:29:19 +08:00
就一个简单的压栈弹栈问题。。。至于么

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/736845

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX