Python re 正则表达式的问题，匹配薪水 low 和 high

2021-03-16 19:28:27 +08:00

chizuo

需求：一次匹配，匹配薪水 low 和 high

字段例子：

0.7-1 万 /元；我想要得到[0.7, 1]
7 万元；我想要得到[7]
0.7 万元；我想要得到[0.7]
13.88-20.5 万 /元；我想要得到[13.88, 20.5]
2-20.5 万 /元；我想要得到[2, 20.5]
1-20 万 /元；我想要得到[1, 20]

在正则表达式在线上（ https://c.runoob.com/front-end/854 ）用这个\d+(\.\d+)?能测试通过

但是使用python re.findall(pattern, str)得到结果却不尽如人意

例如：0.7-1 万 /元；我想要得到[0.7, 1]

s = "0.7-1 万 /元"
p = "\d+(\.\d+)?"
print(re.findall(p, s))
# 得到[0, 7, 1]

求助各位大伙，有无 python 一次匹配可以得到的方法，谢谢啦

2444 次点击

所在节点

Python

9 条回复

Mitt

2021-03-16 19:33:04 +08:00

([0-9\.]+)(?:-([0-9\.]+))?

pakro888

2021-03-16 19:39:54 +08:00

@Mitt #1 楼主似乎不需要匹配“-”

删掉应该就匹配楼主的要求了：

([0-9\.]+)(?:([0-9\.]+))?

chizuo

2021-03-16 20:01:02 +08:00

@Mitt @pakro888

谢谢谢谢！我发现我好像理解错（）圆括号的用途了，我以为的是将圆括号里的内容打包，比如(abc)?代表 abc 出现 0 次或 1 次，但我又查了下，这个群组大概是多种匹配的意思。

使用(?:abc)?即圆括号里开头加上?:才是我想要的“打包”的意思，我这样理解对吗？所以表达式可以\d+(?:\.\d+)?

非常感谢！

zyb201314

2021-03-16 21:24:30 +08:00

这里(?:exp)没有必要吧？
还有例子字符串中除了 float 中有'点', 没有其它单独的'点'.那么直接获取数字和点就 ok 了.如:
s="0.7-1 万 /元；"
print(re.findall("[\d\.]+" , s))

chizuo

2021-03-16 22:51:05 +08:00

@zyb201314 优秀，你这个是最简洁的，但是我还是用我那个，更严格一些，你懂得，你永远也不知道未知的数据长啥样 hhh

HelloViper

2021-03-17 10:26:21 +08:00

贪婪匹配啊，"[0-9.]{1,}"

secsilm

2021-03-17 16:14:05 +08:00

@chizuo 没错，括号的作用有两种：分组和改变运算符优先级顺序。默认情况下是后者，但如果只想分组，那么就得加上 `?:`。

secsilm

2021-03-17 16:15:46 +08:00

@secsilm 加上 `?:` 后，更准确地说，就变成了 non-capturing group 。

chizuo

2021-03-17 21:19:35 +08:00

@secsilm 学到了，非常感谢！

第 1 页／共 1 页

这是一个专为移动设备优化的页面（即为了让你能够在 Google 搜索结果里秒开这个页面），如果你希望参与 V2EX 社区的讨论，你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/762237

V2EX 是创意工作者们的社区，是一个分享自己正在做的有趣事物、交流想法，可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.