python的数据分析:pandas的分组聚合
2019-08-02 14:47
585 查看
版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/gg0124/article/details/98203633
本文是《数据蛙三个月强化课》的第一篇总结教程,如果想要了解数据蛙社群,可以阅读给DataFrog社群同学的学习建议。温馨提示:如果您已经熟悉pandas,大可不必再看这篇文章,或是之挑选部分文章
数据分析的过程分组统计是一个最常见的场景了,下面我们一起来看下啊。
一:创建数据集
index = pd.Index(data=["Tom", "Bob", "Mary", "James", "Andy", "Alice"], name="name") data = { "age": [18, 30, 35, 18, 22, 30], "city": ["Bei Jing ", "Shang Hai ", "Guang Zhou", "Shen Zhen", "Zhe Jiang", "Su Zhou"], "sex": ["male", "male", "female", "male", "male", "female"], "income": [3000, 8000, 8000, 4000, 6000, 7000] } user_info = pd.DataFrame(data=data, index=index) user_info
我们来看下数据
其中我们把 name作为了索引
二:进行分组
我们统计之前,先进行分组,比如对性别 sex 进行分组
那如果我们对性别 sex 和年龄age 一起分组呢
注意1:我们直接分组后得到的一个对象,来一起看下
注意2:我们可以通过切片来获得分组后的某一列,但是此时也是返回的是一个对象
等下我们来看看具体怎么使用这个切片的
三:遍历分组
下面我们一起看下遍历分组,得到每组的一个情况
如果是根据多个字段来分组的,每个组的名称是一个元组。
那如果我们只选择一个组应该怎么来做呢?
四:聚合操作
我们刚刚看完了分组了,现在来看看统计部分,如求 sum、max、avg等。这时,也需要显身手的agg 来现身了
现在是不是想到我们在第二部分中的切片操作了。
另外,那如果根据多个键进行聚合呢,默认情况下会得到一个多层索引的结构
那如果我们不想要这样的索引结构,只需这样改变就好了
五:对DataFrame 一列应用不同的聚合操作
有时候对于一列,我们可能会有多个聚合操作
六:对DataFrame不同列应用不同的聚合操作
这里我们按照sex,但是对age,salary聚合的规则应该是不同的
七:transform操作
transfrom 方法,会把函数的参数应用到所有的分组中,然后把结果放置到原数组的索引上来
八:apply 操作
apply 会将待处理的对象拆分成多个片段,然后对各片段调用传入的函数,最后尝试用 pd.concat() 把结果组合起来
我们做数据分析的同学,肯定是少不了分组聚合这个操作的,大家要多多练习啊
相关文章推荐
- python/pandas数据分析(十五)-聚合与分组运算实例
- 利用python进行数据分析-pandas.concat/subplots/gropuby/pivot_table,多文件整合、聚合、分组,子图
- python/pandas数据挖掘(十四)-groupby,聚合,分组级运算
- 利用python进行数据分析-数据聚合与分组运算1
- Python数据分析基础(七)——数据聚合与分组
- 利用python进行数据分析之数据聚合和分组运算
- 利用python进入数据分析之数据聚合与数据分组运算
- python数据分析06--Pandas数据归整:聚合和重塑
- 详解pandas数据分析之groupby分组聚合(基于电商平台数据)
- 利用Python进行数据分析--数据聚合与分组运算
- python中pandas数据分析基础3(数据索引、数据分组与分组运算、数据离散化、数据合并)...
- 数据分析之Pandas(十)高级处理-分组与聚合
- Python 数据分析(二 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识
- Python 数据分析(二 本实验将学习利用 Python 数据聚合与分组运算,时间序列,金融与经济数据应用等相关知识
- 利用Python进行数据分析--数据聚合与分组运算
- 利用Python进行数据分析--数据聚合与分组运算1
- python数据分析之:数据聚合与分组运算
- 利用python进行数据分析-数据聚合与分组运算2
- pandas数据分组和聚合操作
- python数据挖掘数据分析pandas的介绍及简单例子