python利用pandas将excel文件转换为txt文件
2018-03-01 11:59
344 查看
python将数据换为txt的方法有很多,可以用xlrd库实现。本人比较懒,不想按太多用的少的插件,利用已有库pandas将excel文件转换为txt文件。直接上代码:'''
function:将excel文件转换为text
author:Nstock
date:2018/3/1
'''
import pandas as pd
import re
import codecs
#将excel转化为txt文件
def exceltotxt(excel_dir, txt_dir):
with codecs.open(txt_dir, 'w', 'utf-8') as f:
neg=pd.read_excel(excel_dir, header=None, index=None)
f.write(neg.to_string())
#去除记录行首的数字和空格
def del_linehead_number_speace(orig_txt_dir,saveas_txt_dir):
with open(orig_txt_dir,'r+') as f, open(saveas_txt_dir,'r+') as fw:
lines = f.readlines()
print(len(lines)) #行数
texts = [re.sub(r'(\d)+(\s)+','',lines[num]) for num in range(len(lines)) ]
texts = list(set(texts)) #去重如果要保留重复记录注释该行
line_num = len(texts)
# for num in range(line_num): #查看转化后的文本
# print(texts[num])
fw.writelines(texts)
exceltotxt('./data/neg.xls', './data/neg_temp.txt')
del_linehead_number_speace('./data/neg_temp.txt','./data/neg.txt')说明:xxx_dir带目标文件名为:xxx_dir='保存路径/'+'文件名'
function:将excel文件转换为text
author:Nstock
date:2018/3/1
'''
import pandas as pd
import re
import codecs
#将excel转化为txt文件
def exceltotxt(excel_dir, txt_dir):
with codecs.open(txt_dir, 'w', 'utf-8') as f:
neg=pd.read_excel(excel_dir, header=None, index=None)
f.write(neg.to_string())
#去除记录行首的数字和空格
def del_linehead_number_speace(orig_txt_dir,saveas_txt_dir):
with open(orig_txt_dir,'r+') as f, open(saveas_txt_dir,'r+') as fw:
lines = f.readlines()
print(len(lines)) #行数
texts = [re.sub(r'(\d)+(\s)+','',lines[num]) for num in range(len(lines)) ]
texts = list(set(texts)) #去重如果要保留重复记录注释该行
line_num = len(texts)
# for num in range(line_num): #查看转化后的文本
# print(texts[num])
fw.writelines(texts)
exceltotxt('./data/neg.xls', './data/neg_temp.txt')
del_linehead_number_speace('./data/neg_temp.txt','./data/neg.txt')说明:xxx_dir带目标文件名为:xxx_dir='保存路径/'+'文件名'
相关文章推荐
- python利用pandas将excel文件转换为txt文件的方法
- nodejs将PDF文件转换成txt文本,并利用python处理转换后的文本文件
- python pandas 读取.txt .dat 文件时,跳读头文件,并把数据读成数组
- 利用python脚本生成caffe的prototxt文件
- 利用caffe的Python接口生成prototxt文件
- 利用python将txt等文件中的数据读为numpy数组
- 利用python对多个txt文件中的数据进行筛选
- Python利用pandas计算多个CSV文件数据值的实例
- 利用python进行数据分析-pandas.concat/subplots/gropuby/pivot_table,多文件整合、聚合、分组,子图
- Python利用pandas计算多个CSV文件数据值
- 利用Python读取文件名并生成txt文件——以图片文件为例
- 利用python读取带有中文的字符串,和将带有中文的字符串写到txt文件中
- 利用python生成caffe训练数集的txt文件
- Python3 pandas read_csv 读取txt文件报错:IOError: Initializing from file failed
- python 利用pandas将arff文件转csv文件
- Caffe学习笔记(二):使用Python生成caffe所需的lmdb文件和txt列表清单文件
- python的pandas工具包,保存.csv文件时不要表头。
- 利用python中的gzip模块压缩和解压数据流和文件
- Python: 3行代码实现txt文件转csv
- Python3 中把txt数据文件读入到矩阵中