python的编码问题
2015-10-15 15:07
501 查看
最近在用python写一些辅助脚本,发现每次运行的时候都会出现无法解析的字符编码的问题
后来发现是因为在代码的头里面加了这么一行
#coding=utf-8
加了这么一行就会出现这个错误
SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xb4 in position 0:
invalid start byte
这个错误的大概意思就是python在寻找UTF-8标致头的时候出现了错误
出现这个错误的原因是我们在文件头给python指定了编码为UTF-8,但是我们文件确是以GBK的方式存储的
所以只要把utf-8改成gbk就可以了,这样python就会认为这是一个gbk的编码文件,而不会想去查找UTF-8的头
题外话:
为了识别文件究竟是UTF-8还是ASCII,一般UTF-8都会在文件头部加入EF BB这个头,而GBK是没有头的,所以python发现没有这个头则会认为是错误的
之前在用QT的时候也遇到了这些问题
http://www.cnblogs.com/linyilong3/p/4868697.html
其实中文编码的问题已经存在很多年了,只是一直没人去解决,最近我开始碰到后,才开始着手解决这个问题,争取有空把原来的中文问题都解决掉
后来发现是因为在代码的头里面加了这么一行
#coding=utf-8
加了这么一行就会出现这个错误
SyntaxError: (unicode error) 'utf-8' codec can't decode byte 0xb4 in position 0:
invalid start byte
这个错误的大概意思就是python在寻找UTF-8标致头的时候出现了错误
出现这个错误的原因是我们在文件头给python指定了编码为UTF-8,但是我们文件确是以GBK的方式存储的
所以只要把utf-8改成gbk就可以了,这样python就会认为这是一个gbk的编码文件,而不会想去查找UTF-8的头
题外话:
为了识别文件究竟是UTF-8还是ASCII,一般UTF-8都会在文件头部加入EF BB这个头,而GBK是没有头的,所以python发现没有这个头则会认为是错误的
之前在用QT的时候也遇到了这些问题
http://www.cnblogs.com/linyilong3/p/4868697.html
其实中文编码的问题已经存在很多年了,只是一直没人去解决,最近我开始碰到后,才开始着手解决这个问题,争取有空把原来的中文问题都解决掉
相关文章推荐
- 使用Python解析JSON数据的基本方法
- python爬虫小项目之计算研究生成绩绩点
- python 变量作用域
- Python表达式操作符
- python下MySQL的使用与练习
- Python显示函数调用堆栈
- 使用IPython增强交互式体验
- windows 环境下 ipython %edit 编辑器配置
- 11.Python标准库_多进程探索 (multiprocessing包)
- Python升级(2.4升级到2.7.3)
- python转码时出现'illegal multibyte sequen'错误
- python 装饰器
- 10.Python标准库_多进程初步 (multiprocessing包)
- LeetCode----Single NumberII
- python写文件乱码
- 测试开发Python培训:实现屌丝的图片收藏愿望(小插曲)
- <LeetCode><Easy>223 Rectange Area
- python & excel
- 基于Python正则表达式提取搜索结果中的站点地址
- 命名元组