python 读取txt出现\xef\xbb\xbf…的问题
2017-11-19 15:46
1176 查看
用python读取txt文件,文件的内容是一列数如下:
2
3
4
5
6
7
8
9
10
11
12
[/code]
但是读取的时候第一个元素为‘\xef\xbb\xbf1883’,上网看了一些资料,原来在python的file对象的readline以及readlines程序中,针对一些UTF-8编码的文件,开头会加入BOM来表明编码方式。
解决方法有很多种:
1.这篇博客引用codecs模块,来判断前三个字节是否为BOM_UTF8。如果是,则剔除\xef\xbb\xbf字节。
2.另外还有很多解决方案,可以判断列表中是否有\xef\xbb\xbf字符,如果有,用replace()替换为空的,代码如下:
1883 1886 1900 1900 1897 1897 1897 1897 1906 1917 1910 19101
2
3
4
5
6
7
8
9
10
11
12
[/code]
但是读取的时候第一个元素为‘\xef\xbb\xbf1883’,上网看了一些资料,原来在python的file对象的readline以及readlines程序中,针对一些UTF-8编码的文件,开头会加入BOM来表明编码方式。
解决方法有很多种:
1.这篇博客引用codecs模块,来判断前三个字节是否为BOM_UTF8。如果是,则剔除\xef\xbb\xbf字节。
2.另外还有很多解决方案,可以判断列表中是否有\xef\xbb\xbf字符,如果有,用replace()替换为空的,代码如下:
f = open("2017-5-17-1.txt","r") lightSen = [] for line in f.readlines(): if '\xef\xbb\xbf' in line: str1 = line.replace('\xef\xbb\xbf','')#用replace替换掉'\xef\xbb\xbf' lightSen.append(int(str1.strip()))#strip()去掉\n else: lightSen.append(int(line.strip())) print(lightSen) f.close
相关文章推荐
- python 读取txt出现\xef\xbb\xbf…的问题
- python读取带数字的文章路径出现\xef\xbb\xbf…的问题
- python2 读取文件TXT编码问题
- 用Python3读取CSV类型文件时出现无效字节延续的问题
- python 将txt文档导入excel中出现的unicode error问题
- python读取.mat文件时出现’NotImplementedError: Please use HDF reader for matlab v7.3 files‘问题的解决方案
- Python3读取深度学习CIFAR-10数据集出现的若干问题解决
- 关于C++ Builder 和 Dephi读取文本文件TXT出现中文乱码的问题
- 安卓按键读取txt开头出现未知字符的问题
- python读取txt文件时的中文乱码问题
- C#中读取txt文件中的中文时出现乱码问题
- Python中读取txt文本出现“ 'gbk' codec can't decode byte 0xbf in position 2: illegal multibyte sequence”的解决办法
- 关于使用IDEA读取txt文件出现中文乱码的问题
- 学习python出现的问题_读取表格分界符不对
- Learning Python 015 Python3解决问题:读取文件时,出现乱码或者“UnicodeDecodeError 'gbk' codec can't decode” 错误
- Python读取中文txt乱码问题
- python读取和写入txt 编码问题
- 关于javascript从txt文件中读取内容出现乱码的问题
- python 读一个utf8编码的文本文件,为啥有\xef\xbb\xbf文件头呢?怎么处理呀
- 我用python将结果写入txt文件出现的编码问题及其解决方法