您的位置:首页 > 编程语言 > Python开发

python数据分析第一步:读取以及查看数据

2016-11-29 09:09 295 查看
 

用python做数据分析第一步,通常会遇到需要将现成文件(数据库里导出来,或者其他情况下获得的各种文件)拿来处理分析的情况,下面来说下利用python的标准库pandas来读取以及查看数据的方法

1、文件读取

首先将用到的pandas和numpy加载进来

import pandas as pd

import numpy as np

读取数据:

#csv和xlsx分别用read_csv和read_xlsx,下面以xlsx


为例

df=pd.read_csv('f:\1024.csv') 

2、查看数据

df.head()  

#默认出5行,括号里可以填其他数据

3、查看数据类型

df.dtypes

4、利用现有数据生成一列新数据

比如:max_time和min_time是现有的两列,现在业务需要生成一列gs,gs=max_time-min_time

df.['gs']=df.['max_time']-['min_time']

#查看是否成功

df.head()

5、查看基本统计量

df.describe(include='all')  # all代表需要将所有列都列出

 

好了,今天就这么多了,以上代码都运行检验过

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: