您的位置:首页 > 其它

pandas常用的数据分析函数(一)

2017-01-29 12:20 260 查看
(1)查看数据函数

当收集到某一csv文件数据时,常用的查看函数

inspect_dataset(df_data)

def inspect_dataset(df_data):
"""
查看加载的数据基本信息
"""
print '数据集基本信息:'
print df_data.info()

print '数据集有%i行,%i列' %(df_data.shape[0], df_data.shape[1])
print '数据预览:'
print df_data.head()


 此函数传进的参数df_data为一DataFrame文件,其他文件需要相应的格式转化
(2)处理缺失数据函数
  当数据文件中有缺失数据时,用此函数处理Na数据:
def process_missing_data(df_data):
"""
处理缺失数据
"""
if df_data.isnull().values.any():
# 存在缺失数据
print '存在缺失数据!'
df_data = df_data.fillna(0.) # 填充nan
# df_data = df_data.dropna() # 过滤nan
return df_data #返回数据
#return df_data.reset_index()     #此为返回重置索引
 此函数传进的参数df_data扔然为一DataFrame文件,其他文件需要相应的格式转化,
 当需要直接过滤时时用df_data.dropna(),
 当需要填充为数值或字符串时用df_data.fillna(0.)
 当需要返回数据时用return df_data
 当需要返回其处理后数据的重置索引时,用reset_index()
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: