小白问题,关于 python unicode。

2016-09-11 08:51:35 +08:00
 prefere

# -*- coding:utf-8 -*- # python 2.7 windows IDLE symbol_u = "æ".decode("utf-8") print repr(symbol_u),u"\u00E6" >>u'\xe6' æ

问题:

符号 "æ" 的 unicode 值为 00E6 ,为什么 python 会解码为 u'\xe6' ?

如果希望 python 解码为 u"\u00E6",要怎样作呢?

2460 次点击
所在节点    Python
5 条回复
loading
2016-09-11 08:58:00 +08:00
\x 是表示 16 进制, 00E6 和 e6 是一样的,就补 0 和大写的区别。
loading
2016-09-11 08:59:48 +08:00
你用 type 看看,就知道了
prefere
2016-09-11 09:01:15 +08:00
@loading 直接拿正则替换吗?文本里有 n 多个这种字符,怕转错了。有别的方法吗?
prefere
2016-09-11 09:06:17 +08:00
@loading 明白了,谢谢。
romanticbao
2016-09-17 02:50:12 +08:00
搜索一下 “ python 编码”,一大堆结果。耐心看完几个就可以了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/305389

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX