V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
acone2003
V2EX  ›  Python

怎样解决编码问题?

  •  
  •   acone2003 · 2018-09-06 10:29:35 +08:00 · 1846 次点击
    这是一个创建于 2030 天前的主题,其中的信息可能已经有所发展或是发生改变。
    我计算机本地有一个 CSV 文件,表头汉字编码格式是 ASCII,我用 spider(pyton 3.6)的 pandas 读取的时候显示 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc9 in position 3: invalid continuation byte
    问一下该怎么解决?
    7 条回复    2018-09-06 11:40:09 +08:00
    chenstack
        1
    chenstack  
       2018-09-06 10:55:51 +08:00
    csv 也是文本文件,要么手动处理成 utf-8 编码的再读取,要么用 pandas read_csv 时指定 encoding
    glacer
        2
    glacer  
       2018-09-06 11:12:15 +08:00
    reload(sys)
    sys.setdefaultencoding('utf8')
    holajamc
        3
    holajamc  
       2018-09-06 11:14:24 +08:00
    @glacer python3 已经没有这个函数了:)
    bmos
        4
    bmos  
       2018-09-06 11:31:25 +08:00
    我用比较笨的方法,直接指定编码方式,open,然后 readlines,list 再转化成其他格式。。占个座看看有没有好的方法。
    Cooky
        5
    Cooky  
       2018-09-06 11:35:13 +08:00 via Android
    @bmos iconv 一条命令的事情,少写点代码(
    acone2003
        6
    acone2003  
    OP
       2018-09-06 11:36:12 +08:00
    谢谢 chenstack,搞定!同时也谢谢楼上两位
    raysonx
        7
    raysonx  
       2018-09-06 11:40:09 +08:00 via Android
    你说的汉字编码是 GB 吧,ASCII 不支持中文。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1193 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 23:17 · PVG 07:17 · LAX 16:17 · JFK 19:17
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.