py2 怎么将汉字转换为 XML 里表示的&#xxxx 形式?

2021-01-24 10:43:45 +08:00
 oldbird

&#xxxx 是什么编码格式? py2 怎么将汉字转换为这种形式? XML 里用的

1716 次点击
所在节点    Python
6 条回复
ClericPy
2021-01-24 10:51:36 +08:00
# -*- coding: utf-8 -*-

from html import escape

print(escape(u'中文').encode('ascii', 'xmlcharrefreplace').decode('u8'))

python - Convert HTML entities to Unicode and vice versa - Stack Overflow - https://stackoverflow.com/questions/701704/convert-html-entities-to-unicode-and-vice-versa
mxT52CRuqR6o5
2021-01-24 10:54:05 +08:00
HTML 转义字符?
bertonzh
2021-01-24 10:55:23 +08:00
xxxx 是十进制的 unicode,所以你只需要把每个字符转成 code 就行。
或者 &#xyyyy; 类似 yyyy 是十六进制格式。
oldbird
2021-01-24 11:44:28 +08:00
@ClericPy
打印结果为 ÖÐÎÄ
怎么让一个汉字对应&#xxxx; ??
ClericPy
2021-01-24 11:55:12 +08:00
@oldbird 没懂你说的具体是什么... 举个例子? 我打印的直接丢 HTML 里就是中文俩字

[Running] python2 -u "demo.py"
中文
no1xsyzy
2021-01-25 13:48:19 +08:00
@oldbird 文件不要保存为 GBK

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/747813

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX