您的位置：首页 > 编程语言 > Python开发

Python编码错误处理

2012-10-18 18:07 495 查看

如题，我用python 解析文件（文件中含有中文），并写入其他文件时报错：

UnicodeEncodeError: 'ascii' codec can't encode characters

经过google大神的指导，确定以下解决方式：

#coding:utf-8       import sys        reload(sys)       sys.setdefaultencoding('utf-8')

疑问：为什么需要reload呢？

grep -r -i 'setdefaultencoding' /usr/lib/python2.7    输出结果为：
/usr/lib/python2.7/site.py:        sys.setdefaultencoding(encoding) # Needs Python Unicode build !
/usr/lib/python2.7/site.py:    # Remove sys.setdefaultencoding() so that users cannot change the
/usr/lib/python2.7/site.py:    if hasattr(sys, "setdefaultencoding"):
/usr/lib/python2.7/site.py:        del sys.setdefaultencoding
Binary file /usr/lib/python2.7/site.pyc matches

把del sys.setdefaultencoding 防止用户在改变defaultencoding ，这个原因暂时真不知。。

对于windows平台，上面的办法真不行，对于python 2.x中，总是存在这个问题，在Python 3.x的时候这真不是个事，

对于windows 平台，

文件开头声明为 #coding=utf-8,

写入字符串时，转换编码为GBK

file.write(str.encode('gbk'))

还要注意的是：open(....) 不能有任何运算，一次只能写入一行，所以要用 + 来连成一行

# coding=utf-8

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： Unicode Python

相关文章推荐

新的分享

章节导航