Python拆分大型CSV文件代码实例
2019-10-07 08:36
1321 查看
这篇文章主要介绍了Python拆分大型CSV文件代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
#!/usr/bin/env python3 # -*- coding:utf-8 -*- # @FileName :Test.py # @Software PyCharm import os import pandas as pd # filename为文件路径,file_num为拆分后的文件行数 # 根据是否有表头执行不同程序,默认有表头的 def Data_split(filename,file_num,header=True): if header: # 设置每个文件需要有的行数,初始化为1000W chunksize=10000 data1=pd.read_table(filename,chunksize=chunksize,sep=',',encoding='gbk') # print(data1) # num表示总行数 num=0 for chunk in data1: num+=len(chunk) # print(num) # chunksize表示每个文件需要分配到的行数 chunksize=round(num/file_num+1) # print(chunksize) # 分离文件名与扩展名os.path.split(filename) head,tail=os.path.split(filename) data2=pd.read_table(filename,chunksize=chunksize,sep=',',encoding='gbk') i=0 for chunk in data2: chunk.to_csv('{0}_{1}{2}'.format(head,i,tail),header=None,index=False) print('保存第{0}个数据'.format(i)) i+=1 else: # 获得每个文件需要的行数 chunksize=10000 data1=pd.read_table(filename,chunksize=chunksize,header=None,sep=',') num=0 for chunk in data1: num+=len(chunk) chunksize=round(num/file_num+1) head,tail=os.path.split(filename) data2=pd.read_table(filename,chunksize=chunksize,header=None,sep=',') i=0 for chunk in data2: chunk.to_csv('{0}_{1}{2}'.foemat(head,i,tail),header=None,index=False) print('保存第{0}个数据'.format(i)) i+=1 filename='文件路径' #num为拆分为的文件个数 Data_split(filename,num,header=True)
以上就是本文的全部内容,希望对大家的学习有所帮助
您可能感兴趣的文章:
相关文章推荐
- python读写csv文件并增加行列的实例代码
- python读写csv文件实例代码
- 使用Python对Csv文件操作实例代码
- Python 文件操作技巧(File operation) 实例代码分析
- Python实现多线程下载文件的代码实例
- Python3 requests文件下载 期间显示文件信息和下载进度代码实例
- python使用正则搜索字符串或文件中的浮点数代码实例
- Python读csv文件去掉一列后再写入新的文件实例
- python 搜索大文件的实例代码
- python3.4学习笔记(二十六) Python 输出json到文件,让json.dumps输出中文 实例代码
- 详解python脚本自动生成需要文件实例代码
- c++实现合并文件以及拆分实例代码
- python 通过 socket 发送文件的实例代码
- python基于json文件实现的gearman任务自动重启代码实例
- Python实现截取PDF文件中的几页代码实例
- php导出csv文件,可导出前导0实例代码
- python 实现自动远程登陆scp文件实例代码
- java代码实现CSV文件读取、将数据拆分成多个CSV文件及数据导出到CSV文件
- python3使用scrapy生成csv文件代码示例
- python读取csv文件并把文件放入一个list中的实例讲解