pandas数据预处理与透视表
2017-03-13 09:42
183 查看
以下代码是基于python3.5.0编写的
import pandas as pd import numpy as np titanic_survival = pd.read_csv("titanic_train.csv") # ---------------------------统计age列有多少值为空------------------------- age = titanic_survival["Age"] age_is_null = pd.isnull(age) age_null_true = age[age_is_null] age_null_count = len(age_null_true) print(age_null_count) #-------------------------求均值方法一---------------------------------------- good_ages = titanic_survival["Age"][age_is_null == False] #把age列中不为空的值赋值给good_ages correct_mean_age = sum(good_ages) / len(good_ages) print(correct_mean_age) #-------------------------求均值方法二---------------------------------------- correct_mean_age = titanic_survival["Age"].mean() #mean函数会自动取出age列中为空的值,然后赋值给correct_mean_age print(correct_mean_age) #-----------------------------统计每种等级船舱平均票价------------------------------ passenger_classes = [1, 2, 3] fares_by_class = {} for this_class in passenger_classes: pclass_rows = titanic_survival[titanic_survival["Pclass"] == this_class] #找出Pclass为1的所有行 pclass_fares = pclass_rows["Fare"] #找出Pclass为1的Fare列 fare_for_class = pclass_fares.mean() fares_by_class[this_class] = fare_for_class print(fares_by_class) # -----------------pivot_table透视表函数,找出每种Pclass所对应Survived的平均值------------------------------------- passenger_survival = titanic_survival.pivot_table(index="Pclass", values="Survived", aggfunc=np.mean) print(passenger_survival) passenger_age = titanic_survival.pivot_table(index="Pclass", values="Age", aggfunc=np.mean) print(passenger_age) port_stats = titanic_survival.pivot_table(index="Embarked", values=["Fare","Survived"], aggfunc=np.sum) print(port_stats)
相关文章推荐
- Pandas数据预处理与透视表
- 数据预处理(1) ——数据清洗 使用python(sklearn,pandas,numpy)实现
- 数据预处理(3) ——数据归约 使用python(sklearn,pandas,numpy)实现
- 数据预处理_Pandas
- python:用Pandas透视表处理数据
- Pandas常用数据预处理方法及指令
- 【pandas】[5] 数据行列转置,数据透视(stack,unstack,pviot,pviot_table)
- 对pandas进行数据预处理的实例讲解
- 利用Python Pandas进行数据预处理-数据清洗
- 利用Python Pandas进行数据预处理-数据清洗
- Pandas基础教程 数据读取 索引与计算 数据预处理 自定义函数
- 基于【pandas】的数据预处理(含定制【OneHotEncoder】方法)
- pandas做数据分析(三):常用预处理操作
- 利用python Pandas进行数据预处理
- Python数据分析模块 | pandas做数据分析(二):常用预处理操作
- Python使用pandas读取Excel文件数据和预处理小案例
- 数据预处理(2) ——数据变换与数据离散化 使用python(sklearn,pandas,numpy)实现
- Pandas对行情数据的预处理
- Pandas透视表处理数据(转)
- pandas数据预处理之dataframe的groupby操作方法