您的位置:首页 > 编程语言 > Python开发

python数据分析 第7天 数据的加载,存储,与文件格式

2018-02-01 20:39 459 查看

数据的加载,存储,与文件格式

1  读取文本格式的数据



这些函数的选项可划分为一下几类:



JSON数据

已经成为,发送数据的标准格式之一
通过json.loads 可将JSON字符串转换成PYTHON形式
json.dumps    将python对象转换为 JSON形式
JSON必须为字符串

 向DataFrame传入一组JSON对象

XML  HTML   WEB信息收集

lxml 是python库,可以处理HTML  XML格式的文件
先用lxml.html处理HTML   然后用lxml.objectify 做一些XML处理
P185-P190

利用lxml.objectify解析XML

二进制数据格式

pandas对象   有一个用于将数据以pickle形式保存到磁盘上的save方法

使用HDF5格式

是一个C库
需要处理海量数据,学习PyTables 和 h5py

读取Microsoft Excel 文件

pandas的ExcelFile类 支持读取存储在Excel 中的表格数据
需要先安装 xlrd   openpyxl包

使用HTML和WebAPI

使用requests包

使用数据库

存取MongoDB中的数据

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: