python处理不同编码格式的文件
2013-02-25 11:01
465 查看
1. 使用python处理utf-16le编码格式的文件
使用codecs模块打开文件
对文件内容按行进行处理时,发现第一行的编码老是有问题。使用MadEdit编辑器以16进制查看文件时,发现如下图编码:
从图中可以看出,文件中的内容【以前】是从第2位编码开始的,同时“以”对应2,3字节,所以在处理文件的第一行时需要过滤前两个字节的编码FFFE。
这样就可以正常读取文件内容了!
使用codecs模块打开文件
file = codecs.open(newfile, 'r', 'utf-16le')
对文件内容按行进行处理时,发现第一行的编码老是有问题。使用MadEdit编辑器以16进制查看文件时,发现如下图编码:
从图中可以看出,文件中的内容【以前】是从第2位编码开始的,同时“以”对应2,3字节,所以在处理文件的第一行时需要过滤前两个字节的编码FFFE。
if i == 0: key = lines_expect[i][1:] else: key = lines_expect[i]
这样就可以正常读取文件内容了!
相关文章推荐
- 解决python with 在写入文件是因编码格式不同而造成乱码问题
- nginx的web目录下处理中文文件和文件夹以及编码格式问题
- 使用python 3.0 处理utf8格式的文件BOM问题
- python第三方库推荐之tablib(用于导出数据到不同的文件格式)
- Python 查看文件的编码格式
- Python中使用不同编码读写txt文件详解
- Python_批量修改文件的编码格式
- 【转】python基础===codecs打开文件,解决文件编码格式的问题
- python解析plist文件gb2312编码格式到utf-8编码格式
- ubuntu下读取 不同编码格式的文件 读取中文
- Python 中的文件编码格式
- 读取和写入不同编码格式的文件
- python的文件格式有两种,"*.py"和"*.pyw",它们有什么不同
- iphone阅读器,如果要读取一个文本文件,请问你是如何处理编码问题的?另外像pdf格式的文件,你如何读取。?
- python 处理中文文件时的编码问题,尤其是utf-8和gbk
- python处理json格式的文件
- Python处理以BOM开头的UTF-8编码文件
- Python中使用不同编码读写txt文件详解
- Python 处理 ini 格式文件
- python创建文件的编码格式