Python 菜鸟求助正则(?:...)

2018-05-31 18:57:09 +08:00
 mikefy

在 python 核心编程中看到这样一个例子: ''' print re.findall('http://(?:\w+.)(\w+.com)', 'http://code.google.com') ''' 最后的结果是输出['google.com']. 请问为什么前面的 http://没有掉了,求助...

2374 次点击
所在节点    Python
12 条回复
liuxu
2018-05-31 19:00:04 +08:00
正则的()是捕获匹配,会返回的,其他的不会返回给你
malaohu
2018-05-31 19:03:34 +08:00
建议楼主 查询一下 ?: 的意思
summerwar
2018-05-31 19:03:50 +08:00
因为没有在括号里
summerwar
2018-05-31 19:08:50 +08:00
(?:pattern)

匹配 pattern,但不捕获匹配结果。

顺手学了个新东西,感谢
mikefy
2018-05-31 19:12:05 +08:00
原来这就是子组...另外这里有写错没有给.加上反斜杠没人看见吗...嘎嘎
F1024
2018-05-31 19:17:59 +08:00
()= 分组匹配 = 捕获组

即只会返回括号内的内容

(?:)只匹配不显示

(?:\w+.) 这句匹配到了" code. "只匹配不显示
(\w+.com)' 这句匹配 google.com 并显示出来
hahastudio
2018-05-31 19:20:04 +08:00
1. help('re.findall') Return a list of all non-overlapping matches in the string
2. https://deerchao.net/tutorials/regex/regex.htm 匹配 exp,不捕获匹配的文本,也不给此分组分配组号
hahastudio
2018-05-31 19:21:08 +08:00
@mikefy 反正 . 也匹配 .
0x400
2018-05-31 19:22:47 +08:00
所以要怎么才能返回全部呢。比如我想要以 a 或者 b 开头加后面五个任意字符(a|b).{5}这样肯定不行,只能(a.{5}|b.{5}),但是。。。如果有 abcdefg 等等很多情况开头呢,又或者后面相同的条件也很长。。。
liuxu
2018-05-31 19:26:34 +08:00
@0x400
([a-z].{5})
xml123
2018-05-31 19:37:08 +08:00
@0x400 把你想返回的部分加个括号就行了,返回整个匹配就加到最外面,另外表达式里没出现括号好像也是返回整个匹配。
F1024
2018-05-31 19:38:01 +08:00
@0x400

import re
print(re.findall('\w+\d+', 'abcdefg12345')) 这样岂不美哉

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/459354

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX