关于 Python re 正则的一个请教

C:\Users\Delectate>python
Python 3.7.0 (v3.7.0:1bf9cc5093, Jun 27 2018, 04:59:51) [MSC v.1914 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import re
>>> str="https://www.douban.com/people/50583134/"
>>> re.findall("\d+", str)
['50583134']
>>>

imlinhanchao

2019-09-05 09:05:06 +08:00

完全可以不用正則吧，鏈接的格式是固定的，就直接用切片就行了：url[-9:-1]

locoz

2019-09-05 11:22:11 +08:00

这种很规则的东西，直接 split 会更方便，比如：
>>> a = "https://www.douban.com/people/50583134/"
>>> a.split("/")
['https:', '', 'www.douban.com', 'people', '50583134', '']
>>> a.split("/")[4]
'50583134'

octalempyrean

2019-09-05 11:32:05 +08:00 via Android

你就爬吧

xiaohanxxx

2019-09-05 15:57:39 +08:00

''.join(re.findall(r'\d+',string))

jxie0755

2019-09-06 01:42:20 +08:00

这个格式如此的固定, 我觉得好像连正则都可以不用. 用字符串的方法就应该能解决.
第一个回答 re.find(r ‘ people/(.*?)/‘, string) 就可以, 但是我会把(.*?)换成(\d*?)这样更精确?

ClericPy

2019-09-06 10:58:36 +08:00

"https?://www\.douban\.com/people/(\d+)/.*"