pandas常用的数据分析函数(一)
2017-01-29 12:20
260 查看
(1)查看数据函数
当收集到某一csv文件数据时,常用的查看函数
此函数传进的参数df_data为一DataFrame文件,其他文件需要相应的格式转化
(2)处理缺失数据函数
当数据文件中有缺失数据时,用此函数处理Na数据:
def process_missing_data(df_data):
"""
处理缺失数据
"""
if df_data.isnull().values.any():
# 存在缺失数据
print '存在缺失数据!'
df_data = df_data.fillna(0.) # 填充nan
# df_data = df_data.dropna() # 过滤nan
return df_data #返回数据
当需要直接过滤时时用df_data.dropna(),
当需要填充为数值或字符串时用df_data.fillna(0.)
当需要返回数据时用return df_data
当需要返回其处理后数据的重置索引时,用reset_index()
当收集到某一csv文件数据时,常用的查看函数
inspect_dataset(df_data)
def inspect_dataset(df_data): """ 查看加载的数据基本信息 """ print '数据集基本信息:' print df_data.info() print '数据集有%i行,%i列' %(df_data.shape[0], df_data.shape[1]) print '数据预览:' print df_data.head()
此函数传进的参数df_data为一DataFrame文件,其他文件需要相应的格式转化
(2)处理缺失数据函数
当数据文件中有缺失数据时,用此函数处理Na数据:
def process_missing_data(df_data):
"""
处理缺失数据
"""
if df_data.isnull().values.any():
# 存在缺失数据
print '存在缺失数据!'
df_data = df_data.fillna(0.) # 填充nan
# df_data = df_data.dropna() # 过滤nan
return df_data #返回数据
#return df_data.reset_index() #此为返回重置索引此函数传进的参数df_data扔然为一DataFrame文件,其他文件需要相应的格式转化,
当需要直接过滤时时用df_data.dropna(),
当需要填充为数值或字符串时用df_data.fillna(0.)
当需要返回数据时用return df_data
当需要返回其处理后数据的重置索引时,用reset_index()
相关文章推荐
- pandas做数据分析(四):常用函数
- 数据分析处理库Pandas-常用函数
- python/pandas/numpy数据分析(十)-函数, rank,重复索引
- pandas做数据分析(三):常用预处理操作
- 数据分析—numpy(常用的函数)
- python数据分析常用函数
- Python数据分析模块 | pandas做数据分析(三):统计相关函数
- Python常用的数据分析工具入门: numpy和pandas入门
- Python数据分析常用手册——Numpy和Pandas
- 数据分析常用函数列表
- Python数据分析常用函数笔记
- pandas做数据分析(五):统计相关函数
- 数据分析之Pandas-03绘图函数
- Python pandas数据分析中常用方法
- 用Python做数据分析:Pandas常用数据查询语法
- 数据分析之Pandas(二):索引、过滤 、算术运算、 函数应用和映射
- Python 数据分析之Pandas and Numpy (数据类型的介绍和数据处理的常用运算)
- Python数据分析与挖掘实战(Pandas,Matplotlib常用方法)
- Python pandas数据分析中常用方法
- R中常用的数据分析函数