强悍的Python读取大文件的解决方案
2019-02-17 00:10
603 查看
Python 环境下文件的读取问题,请参见拙文 Python基础之文件读取的讲解
这是一道著名的 Python 面试题,考察的问题是,Python 读取大文件和一般规模的文件时的区别,也即哪些接口不适合读取大文件。
1. read() 接口的问题
f = open(filename, 'rb') f.read()
我们来读取 1 个 nginx 的日至文件,规模为 3Gb 大小。read() 方法执行的操作,是一次性全部读入内存,显然会造成:
MemoryError
...
也即会发生内存溢出。
2. 解决方案:转换接口
- (1)readlines() :读取全部的行,构成一个 list,实践表明还是会造成内存的问题;
for line in f.reanlines(): ...
- (2)readline():每次读取一行,
while True: line = f.readline() if not line: break
- (3)read(1024):重载,指定每次读取的长度
while True: block = f.read(1024) if not block: break
3. 真正 Pythonic 的方法
真正 Pythonci 的方法,使用 with 结构:
with open(filename, 'rb') as f: for line in f: <do something with the line>
对可迭代对象 f,进行迭代遍历:for line in f
,会自动地使用缓冲IO(buffered IO)以及内存管理,而不必担心任何大文件的问题。
There should be one – and preferably only one – obvious way to do it.
Reference
How to read large file, line by line in python
总结
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接
您可能感兴趣的文章:
相关文章推荐
- Python OpenCV3 VideoCapture读取视频文件失败解决方案
- 强悍的 Python —— 读取大文件
- 强悍的 Python —— 读取大文件
- Python读取json文件,并转化为字典进行提取字段(出现索引must be int,not str)解决方案
- 强悍的 Python —— 读取大文件
- Python 读取配置文件 生成配置文件 试例
- 用python读取大文件
- python 实现文件打开读取内容然后写入更新内容(文件只打开一次)
- Python读取大文件的"坑“与内存占用检测
- python:文件的读取、创建、追加、删除、清空
- python写的读取json配置文件
- Python实现读取TXT文件数据并存进内置数据库SQLite3的方法
- python 读取配置文件
- python读取本地文件夹下所有文件并插入数据库
- python3读取csv和xlsx文件的实例
- Python逐块读取大文件行数的代码 - 为程序员服务
- python如何读取文件夹下的所有文件
- python15 读取文件
- python读取文件操作
- python Pandas 读取数据,写入文件