python 读取txt出现\xef\xbb\xbf…的问题
2017-05-23 13:43
806 查看
用python读取txt文件,文件的内容是一列数如下:
但是读取的时候第一个元素为‘\xef\xbb\xbf1883’,上网看了一些资料,原来在python的file对象的readline以及readlines程序中,针对一些UTF-8编码的文件,开头会加入BOM来表明编码方式。
解决方法有很多种:
1.这篇博客引用codecs模块,来判断前三个字节是否为BOM_UTF8。如果是,则剔除\xef\xbb\xbf字节。
2.另外还有很多解决方案,可以判断列表中是否有\xef\xbb\xbf字符,如果有,用replace()替换为空的,代码如下:
1883 1886 1900 1900 1897 1897 1897 1897 1906 1917 1910 1910
但是读取的时候第一个元素为‘\xef\xbb\xbf1883’,上网看了一些资料,原来在python的file对象的readline以及readlines程序中,针对一些UTF-8编码的文件,开头会加入BOM来表明编码方式。
解决方法有很多种:
1.这篇博客引用codecs模块,来判断前三个字节是否为BOM_UTF8。如果是,则剔除\xef\xbb\xbf字节。
2.另外还有很多解决方案,可以判断列表中是否有\xef\xbb\xbf字符,如果有,用replace()替换为空的,代码如下:
f = open("2017-5-17-1.txt","r") lightSen = [] for line in f.readlines(): if '\xef\xbb\xbf' in line: str1 = line.replace('\xef\xbb\xbf','')#用replace替换掉'\xef\xbb\xbf' lightSen.append(int(str1.strip()))#strip()去掉\n else: lightSen.append(int(line.strip())) print(lightSen) f.close
相关文章推荐
- python 读取txt出现\xef\xbb\xbf…的问题
- python读取带数字的文章路径出现\xef\xbb\xbf…的问题
- python读取txt行问题
- python读取和写入txt 编码问题
- python 将txt文档导入excel中出现的unicode error问题
- Python读取中文txt乱码问题
- Python读取TXT文件问题
- Python3读取深度学习CIFAR-10数据集出现的若干问题解决
- 用Python3读取CSV类型文件时出现无效字节延续的问题
- Android小知识——从SD卡中向APP中读取txt文件的时候出现乱码的问题
- python读取txt解决中文乱码问题
- Learning Python 015 Python3解决问题:读取文件时,出现乱码或者“UnicodeDecodeError 'gbk' codec can't decode” 错误
- apache出现\xef\xbb\xbf
- 学习python出现的问题_读取表格分界符不对
- python读取txt文件时的中文乱码问题
- 关于C++ Builder 和 Dephi读取文本文件TXT出现中文乱码的问题
- python读取文件中的第一行出现编码问题
- python2 读取文件TXT编码问题
- python读取.mat文件时出现’NotImplementedError: Please use HDF reader for matlab v7.3 files‘问题的解决方案
- 安卓按键读取txt开头出现未知字符的问题