python默认编码问题
2016-04-19 09:53
543 查看
在python2.7用中文会出现很多问题。
如上所示,写了一小段代码,先用jieba分词,再将分好的词写入.txt文件中,后台总是会报错:nicodeEncodeError: 'ascii' codec can't encode character u'\u6211' in position 0: ordinal not in range(128),即ascii码无法被转换成unicode码。
网上查到的解决方法:
python安装目录下的lib\site-packages文件夹下新建一个sitecustomize.py,文件中的代码为:
成功解决。
另,好像在代码里直接写不行。
在shell中查看默认编码
import jieba import sys #f=open(filename,'r') f=open('10.txt','r') text=f.read() f.close() seg_list=jieba.cut(text,cut_all=False) f=open('1.txt','w') for word in seg_list: print word f.write(word) f.write('\n')
如上所示,写了一小段代码,先用jieba分词,再将分好的词写入.txt文件中,后台总是会报错:nicodeEncodeError: 'ascii' codec can't encode character u'\u6211' in position 0: ordinal not in range(128),即ascii码无法被转换成unicode码。
网上查到的解决方法:
python安装目录下的lib\site-packages文件夹下新建一个sitecustomize.py,文件中的代码为:
import sys sys.setdefaultencoding('utf-8')
成功解决。
另,好像在代码里直接写不行。
在shell中查看默认编码
import sys sys.getdefaultencoding()发现python的编码从ascii改为utf-8。
相关文章推荐
- Python学习笔记(八)——有关文件的操作
- python实现简单socket通信的方法
- 使用DataFrame和numpy生成交叉表(笛卡尔积)
- 【python项目实战】BBS论坛(5)帖子列表展示
- Python实现MapReduce
- python实现域名系统(DNS)正向查询的方法
- Python virtualenv安装库报错SSL: CERTIFICATE_VERIFY_FAILED
- Python实现文件复制删除
- python基础教程第3章——字符串
- 跟黄哥学python序列文章之python方法链(method chaining)
- 跟黄哥学python序列文章之python方法链(method chaining)
- Python-回文检测和布尔操作(and,or,not)
- python 迭代器和生成器的区别
- python与c#的交互模块pythonnet
- python与c#的交互模块pythonnet
- Python 数据处理扩展包: pandas 模块的DataFrame介绍(读写数据库的操作)
- Python核心编程-第二章
- Python 数据处理扩展包: pandas 模块的DataFrame介绍(创建和基本操作)
- Unicode、GBK、UTF-8小结
- Python实现文件复制删除