您的位置:首页 > 编程语言 > Python开发

python3应用openpyxl小结

2017-09-29 16:56 337 查看
引言

代码

参考

引言

一个小任务中需要对excel进行读写操作,使用了openpyxl,整理了读取、遍历、新建、保存excel方法,特此记录。关于正则提取日期的内容参见:python3使用正则表达式小记

代码

# -*- coding: utf-8 -*-
import re
import openpyxl

DATA_FILE = './项目清单.xlsx'#当前目录下待处理文件
SHEETNAME='反措清单'
STORED_FILE = './项目清单out.xlsx'#处理结果保存到当前目录下目标文件

#获取版本列表中日期最新的版本,正常情况下返回日期,如20170707
def getnewversion(versionList):
datelist=[]
result=""
for versionline in versionList:
datelist+=re.findall(r"(?<!SZ)(\d{8}|\d{7}|\d{6})", versionline)#零宽负向断言,排除SZ开头的合同号
if len(datelist) == 0:#如果未匹配出日期,直接返回
return "无匹配日期"
else:
for index in range(len(datelist)):
if len(str(datelist[index]))==8:
result+=""
elif len(datelist[index])==6:#如果是六位日期,先补齐为8位
datelist[index]='20'+datelist[index]
else:#如果是其他位数(7位)的日期,提示
result+="请检查%s日期格式."%datelist[index]
return result+datelist[datelist.index(max(datelist))]#返回提示信息+最新版本

#从软件版本信息中获取日期最新的版本
def getLatestDate(versionText):
listVersion = []
matchV = re.findall(r"((PRS-700U|PRS-7000|PRS7000|PRS700U).+?(?<!SZ)(\d{8}|\d{7}|\d{6}))", versionText,
re.MULTILINE)  # 非贪婪(懒惰)匹配,匹配尽量少的内容,以免将两条版本信息匹配为一条
for matchVersion in matchV:  # findall会匹配所有()分组,取第一个,即最外层()的匹配
listVersion.append(matchVersion[0])
return getnewversion(listVersion)

#wbname==即文件名称,sheetname==工作表名称,可以为空,若为空默认第一个工作表
def readwb(wbname,sheetname):
wb=openpyxl.load_workbook(filename=wbname,read_only=True)
if (sheetname==""):
ws=wb.get_active_sheet()
else:
ws=wb.get_sheet_by_name(sheetname)
data=[]
lastIndex=""
lastVersion=""
i=1
for row in ws.rows:
list=[]
thisIndex=ws.cell(row=i,column=1).value
thisVersion=getLatestDate(ws.cell(row=i,column=5).value)
if lastIndex=="":#如果是首次比较,更新编号即可
lastIndex = thisIndex
lastVersion = thisVersion
elif thisIndex==lastIndex:#如果是相同工程,比较哪个日期更新
if thisVersion=="无匹配日期":
print(str(i)+"无匹配日期")
if thisVersion>lastVersion:#提取的日期更大
for cell in row:
aa = str(cell.value)
if (aa == "None"):
aa = ""
list.append(aa)
data.pop()#删除原有的较小行,新增新的较大行
data.append(list)
lastIndex = thisIndex#更新编号
lastVersion = thisVersion
else:#如果是不同工程,直接加入结果
for cell in row:
aa = str(cell.value)
if (aa == "None"):
aa = ""
list.append(aa)
data.append(list)
lastIndex = thisIndex
lastVersion = thisVersion
i=i+1

print (wbname +"-"+sheetname+"- 已成功读取")
return data

#新建excel
def creatwb(wbname):
wb=openpyxl.Workbook()
wb.save(filename=wbname)
print ("新建Excel:"+wbname+"成功")

# 写入excel文件中 date 数据,date是list数据类型, fields 表头
def savetoexcel(data,fields,sheetname,wbname):
print("写入excel:")
wb=openpyxl.load_workbook(filename=wbname)

sheet=wb.active
sheet.title=sheetname

field=1
for field in range(1,len(fields)+1):   # 写入表头
_=sheet.cell(row=1,column=field,value=str(fields[field-1]))

row1=1
col1=0
for row1 in range(2,len(data)+2):  # 写入数据
for col1 in range(1,len(data[row1-2])+1):
_=sheet.cell(row=row1,column=col1,value=str(data[row1-2][col1-1]))

wb.save(filename=wbname)
print("保存成功")

datas=readwb(DATA_FILE,SHEETNAME)
headerlist=['编号', '名称', '省份', '装置型号', '软件版本', '软件路径', '汇总', '来源']
creatwb(STORED_FILE)
savetoexcel(datas,headerlist,SHEETNAME,STORED_FILE)


参考

python操作excel之openpyxl

Python操作Excel表格(openpyxl)

Python3 读取和写入excel xlsx文件 使用openpyxl
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  python