Python解析HDF文件 分类: Python 2015-06-25 00:16 743人阅读 评论(0) 收藏
2015-06-25 00:16
696 查看
前段时间因为一个业务的需求需要解析一个HDF格式的文件。在这之前也不知道到底什么是HDF文件。百度百科的解释如下:
HDF是用于存储和分发科学数据的一种自我描述、多对象文件格式。HDF是由美国国家超级计算应用中心NCSA(全称:National Center for Supercomputing Application)创建的,为了满足各种领域研究需求而研制的一种能高效存储和分发科学数据的新型数据格式。HDF可以表示出科学数据存储和分布的许多必要条件。
使用Python解析当然会用到第三方的包,如下:
第一个是用来做数学计算的
使用Python读取HDF文件的代码如下:
其实这样获取到数据之后就是
最后写入Excel,代码如下:
HDF是用于存储和分发科学数据的一种自我描述、多对象文件格式。HDF是由美国国家超级计算应用中心NCSA(全称:National Center for Supercomputing Application)创建的,为了满足各种领域研究需求而研制的一种能高效存储和分发科学数据的新型数据格式。HDF可以表示出科学数据存储和分布的许多必要条件。
使用Python解析当然会用到第三方的包,如下:
import math import pandas as pd import xlwt
第一个是用来做数学计算的
math包主要处理数学相关的运算。至于关于
pandas的介绍请点击这里。xlwt这个包是写HDF文件的。
使用Python读取HDF文件的代码如下:
with closing(pd.HDFStore(HDF_FILR_URL)) as store: df = store[date] # index shoule be end -> region -> group df.reset_index(inplace=True) df.set_index(["end", "region", "group"], inplace=True) df.sort_index(inplace=True)
其实这样获取到数据之后就是
pandas提供的函数,获取自己需要的数据。
slice_df = df.loc[dt] rtt = slice_df.rtt.unstack(level=0) / 1000 cwnd = slice_df.cwnd.unstack(level=0) total = slice_df.total.unstack(level=0) rows = rtt.index.tolist() columns = rtt.columns.tolist()
最后写入Excel,代码如下:
def writexcel(listname, name, time): #将数据写入Excel saveurl = EXCEL_FILR_URL + '%s_%s_%s.xls' % (AVG_RTT, time, name) excel_file = xlwt.Workbook() table = excel_file.add_sheet('tcpinfo') index_row = 0 for item in listname: for item_key, item_value in item.items(): table.write(index_row, 0, str(item_key)) table.write(index_row, 1, str(item_value[1][0])) table.write(index_row, 2, str(item_value[1][1])) table.write(index_row, 3, str(item_value[0]).decode('utf-8')) index_row += 1 excel_file.save(saveurl)
相关文章推荐
- Python安装模块出现问题UnicodeDecodeError的解决方法
- Python中的zipfile模块使用详解
- Python 的datetime转成总毫秒数
- python socket之udp说明
- python 远程执行命令、发布文件
- python 分布式进程体验
- python 日期时间处理
- python 压缩每周生成的数据文件
- python常用函数库及模块巧妙用法汇总
- python Multiprocessing 多进程应用
- Python输出字符串或文件颜色显示
- 免密码登录服务器python脚本
- python 常用模块之ConfigParser
- Python偏函数
- Python完善decorator
- python版本的curl工具pycurl学习
- Python学习日记---文件操作
- Python学习笔记
- Show SN: 北京实时公交Python接口 (github.com)
- pImpl用法在Python的示例代码