python数据分析第一步:读取以及查看数据
2016-11-29 09:09
295 查看
用python做数据分析第一步,通常会遇到需要将现成文件(数据库里导出来,或者其他情况下获得的各种文件)拿来处理分析的情况,下面来说下利用python的标准库pandas来读取以及查看数据的方法
1、文件读取
首先将用到的pandas和numpy加载进来
import pandas as pd
import numpy as np
读取数据:
#csv和xlsx分别用read_csv和read_xlsx,下面以xlsx
为例
df=pd.read_csv('f:\1024.csv')
2、查看数据
df.head()
#默认出5行,括号里可以填其他数据
3、查看数据类型
df.dtypes
4、利用现有数据生成一列新数据
比如:max_time和min_time是现有的两列,现在业务需要生成一列gs,gs=max_time-min_time
df.['gs']=df.['max_time']-['min_time']
#查看是否成功
df.head()
5、查看基本统计量
df.describe(include='all') # all代表需要将所有列都列出
好了,今天就这么多了,以上代码都运行检验过
相关文章推荐
- ArrayList 与HashSet的比较,及应用反射读取properties配置文件中的数据进行实例化再调用,以及类加载器的使用;还有HashCode的分析,及导致内存泄露,内存溢出的原因之一
- 查看ros中laser和camera读取的数据以及该数据的含义
- 数据绑定以及Container.DataItem的具体分析
- Discuz 5.0 中读取纯真IP数据函数分析
- 数据绑定以及Container.DataItem几种方式与用法分析
- 数据绑定以及Container.DataItem的具体分析
- 数据绑定以及Container.DataItem的具体分析
- 流和文件:保存和读取字符级数据以及随机访问
- 测试数据度量与控制(第一步:度量分析)
- 数据绑定以及Container.DataItem几种方式与用法分析
- 数据绑定以及Container.DataItem几种方式与用法分析
- 数据绑定以及Container.DataItem几种方式与用法分析
- 数据绑定以及Container.DataItem的具体分析
- 数据绑定以及Container.DataItem的具体分析(转贴)
- 数据绑定以及Container.DataItem的具体分析
- Discuz 5.0 中读取纯真IP数据函数分析
- 数据绑定以及Container.DataItem的具体分析
- 数据绑定以及Container.DataItem的具体分析
- 数据绑定以及Container.DataItem的具体分析
- DataSetCommand 对象读取以及更新数据的方式