(四在农家•美丽乡村),这个点应该怎么处理

2017-03-15 23:18:53 +08:00
 omg21

在网上抓取的新闻,有时候会遇到这样的点,文字编码已经转换过了,但还是会报错 'gbk' codec can't encode character '\u2022' in position 20

不知道该如何处理这个点。系统 是 python3.4+sublime

2057 次点击
所在节点    Python
4 条回复
bxb100
2017-03-15 23:37:00 +08:00
转成 UTF-8 应该能解决啊
PythonAnswer
2017-03-16 02:22:57 +08:00
不 print 出来 是没事的。你的 windows stdout 不是 utf8 。
nyanyh
2017-03-16 07:14:23 +08:00
执行 py 脚本前先在 cmd 执行一下 chcp 65001
backing
2017-03-16 12:33:50 +08:00
可能这个字符 gbk 没有收录,可以考虑用 GB18030

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/347772

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX