python3 编码转换问题

2019 年 9 月 29 日
 akura

b'\xe9'用 py3 如何转换成中文,处理了一个晚上也处理不了这双斜杠的问题!

4396 次点击
所在节点    Python
11 条回复
wevsty
2019 年 9 月 29 日
b'\xe9'不是一个完整的字符序列啊,没办法处理。
akura
2019 年 9 月 29 日
@wevsty 不止,我只是截取前面的一个,还有是双斜杠的,这里只显示一个斜杠
akura
2019 年 9 月 29 日
@wevsty 单斜杠是直接调用 encode('utf8') 但是双斜杠不懂怎么处理
akura
2019 年 9 月 29 日
@akura 写错了, 是 decode 才对
akura
2019 年 9 月 29 日
完整的是,双反斜杠,b'\\xe9\\xe8\\xbf'
momocraft
2019 年 9 月 29 日
你知道这串字节在哪个编码下是中文吗?
akura
2019 年 9 月 29 日
@momocraft 这个如果单反斜杠的话 变量直接调用. decode('utf8') 可以显示中文,但是双反斜杠不知怎么处理才好
Juszoe
2019 年 9 月 29 日
有点繁琐,看看有没更好的
``` python
from binascii import a2b_hex
a2b_hex(b'\\xe6\\x98\\xaf'.replace(b'\\x', b'')).decode()
```
locoz
2019 年 9 月 29 日
试试 str.encode().decode("unicode_escape"),如果出现乱码的话就再加上.encode("latin1").decode("utf-8")
akura
2019 年 9 月 30 日
@locoz 已尝试,可以解决,谢谢大佬!
akura
2019 年 9 月 30 日
@Juszoe 感谢大佬!

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/605521

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX