您的位置:首页 > 编程语言 > Python开发

Python编码错误处理

2012-10-18 18:07 495 查看
如题,我用python 解析文件(文件中含有中文),并写入其他文件时报错:

UnicodeEncodeError: 'ascii' codec can't encode characters

经过google大神的指导,确定以下解决方式:

#coding:utf-8       import sys        reload(sys)       sys.setdefaultencoding('utf-8')

疑问:为什么需要reload呢?

grep -r -i 'setdefaultencoding' /usr/lib/python2.7    输出结果为:
/usr/lib/python2.7/site.py:        sys.setdefaultencoding(encoding) # Needs Python Unicode build !
/usr/lib/python2.7/site.py:    # Remove sys.setdefaultencoding() so that users cannot change the
/usr/lib/python2.7/site.py:    if hasattr(sys, "setdefaultencoding"):
/usr/lib/python2.7/site.py:        del sys.setdefaultencoding
Binary file /usr/lib/python2.7/site.pyc matches

把del sys.setdefaultencoding 防止用户在改变defaultencoding ,这个原因暂时真不知。。

对于windows平台,上面的办法真不行,对于python 2.x中,总是存在这个问题,在Python 3.x的时候这真不是个事,

对于windows 平台,

文件开头声明为 #coding=utf-8,

写入字符串时,转换编码为GBK

file.write(str.encode('gbk'))

还要注意的是:open(....) 不能有任何运算,一次 只能写入一行,所以要用 + 来连成一行

# coding=utf-8
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  Unicode Python