【python】中文的输出,打印,文件编码问题解决方法
2014-02-08 15:08
1211 查看
直接在python中输入中文的字符串会报编译错误SyntaxError: Non-ASCII character,因为python文件默认编码方式是ASCII。如果想要打印中文字符,有两种方式:
1.在文件第一行加入# -*- coding: UTF-8 –*-,修改文件的默认编码方式。然后直接在python 文件编辑中文字符串即可,例如:string = “中文”
2. 将需要打印的中文字符转化成unicode编码并且加上u,例如要打印“我们”,则写成u“\u6211\u4eec”
3. 如果遇到 类似UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0错误,因为在定义中文字符串变量时候,没有加上u,例如:string = “中文”而不是string = u“中文”,
这个时候python会把按照默认的中文字符串用ASCII进行编码,则可能会出现一些错误,要想吧类似string = “中文”的字符串用utf8编码,在文件前面加上如下代码即可:
import sys reload(sys) sys.setdefaultencoding('utf8')
4.字符串前面加了U之后会变成unicode类型,这时候是python独立的一种类型,如果直接写入字符类型的数据库字段或者当成字符串进行操作,可能会遇到意想不到的错误。
5. 如何吧一个 string = '\u5168\u56fd'变成 unicode类型?
用eval("u"+"'\u5168\u56fd'")方法即可
6. scrapy网络爬虫中文乱码问题解决
(1)判断抓取网页字符编码格式
(2)根据获取的编码方式进行解码,然后采用系统默认方式编码
1.在文件第一行加入# -*- coding: UTF-8 –*-,修改文件的默认编码方式。然后直接在python 文件编辑中文字符串即可,例如:string = “中文”
2. 将需要打印的中文字符转化成unicode编码并且加上u,例如要打印“我们”,则写成u“\u6211\u4eec”
print u'\u6211\u662f'
3. 如果遇到 类似UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 in position 0错误,因为在定义中文字符串变量时候,没有加上u,例如:string = “中文”而不是string = u“中文”,
这个时候python会把按照默认的中文字符串用ASCII进行编码,则可能会出现一些错误,要想吧类似string = “中文”的字符串用utf8编码,在文件前面加上如下代码即可:
import sys reload(sys) sys.setdefaultencoding('utf8')
4.字符串前面加了U之后会变成unicode类型,这时候是python独立的一种类型,如果直接写入字符类型的数据库字段或者当成字符串进行操作,可能会遇到意想不到的错误。
5. 如何吧一个 string = '\u5168\u56fd'变成 unicode类型?
用eval("u"+"'\u5168\u56fd'")方法即可
6. scrapy网络爬虫中文乱码问题解决
(1)判断抓取网页字符编码格式
import chardet code_format = chardet.detect(response.body)["encoding"]
(2)根据获取的编码方式进行解码,然后采用系统默认方式编码
import sys type = sys.getfilesystemencoding() response.body.decode(code_format).encode(type)
相关文章推荐
- python csv 格式文件 中文乱码问题解决方法
- python中文编码问题深入分析(二):print打印中文异常及显示乱码问题分析与解决
- Python处理unicode编码的txt文件(Python中文处理)——解决to_excel()和to_csv()导出文件内容为空的问题
- 简单解决Python文件中文编码问题
- 【转】python csv 格式文件 中文乱码问题解决方法
- 我用python将结果写入txt文件出现的编码问题及其解决方法
- 关于Android Logcat打印输出中文乱码问题的解决方法
- 简单解决Python文件中文编码问题
- 简单解决Python文件中文编码问题
- Python实现的json文件读取及中文乱码显示问题解决方法
- python中遇到包含UTF-8编码中文的列表或字典的输出的解决方法
- python中遇到包含UTF-8编码中文的列表或字典的输出的解决方法
- 分析:windows下cmd默认的编码是ASCII编码 ,windows的中文环境下编码是GBK 方法一:在保存输出流保存的时候做一个对文字GBK编码,在输出到文件 如下 [python] view
- 记录使用python时遇到的中文 编码问题与解决方法
- 程序输出urf-8编码的xml文件中文(汉字)乱码问题解决方法
- Python | 多种编码文件(中文)乱码问题解决 chardet模块
- python 字典中有中文,写入文件变为编码的解决方法
- 命令行编译java源文件提示 “编码GBK的不可映射字符” 及输出的中文变为乱码的解决方法
- 用python写文件输出,解决输出的中文为乱码问题
- 7、定义一个文件输入流,调用read(byte[] b) 方法将exercise.txt文件中的所有内容打印出来(byte数组的大小限制为5,不考虑中文编码问题)。