万能的 v 友,请问 'module' object(urllib)has no attribute 'parse'时如何处理 url 中的中文?

2019-03-11 17:24:38 +08:00
 0yster

pyversion=2.7.16 在给 hexo 博客写备份所有图片的脚本,由于发布的文章标题时常会有中文、英文、中英混杂的情况,而 hexo 博客文章的链接直接由时间和标题生成因而带了部分的中文。这种链接肯定要做处理。 查了一下别人用 urllib.parse.quote(url, safe=":/=?#")来处理字符串中部分的中文 但是莫名奇妙地报了如题的错

于是改用正则 patt=re.compile('([\u4e00-\u9fa5]*?)') res=re.search(patt,posturl).group(1)

结果发现匹配不到,想不明白哪里错了...

只能过来求助 v 友了,求个解决方案

1999 次点击
所在节点    程序员
2 条回复
GoLand
2019-03-11 19:35:59 +08:00
```python
import urlparse
urlparse.urlparse(xxx)
```
Arnie97
2019-03-12 00:36:24 +08:00
因为别人用的是 Python 3,这个改名了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/543409

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX