您的位置:首页 > 编程语言 > Python开发

Python每日一记39>>>pandas创建数据透视表&多维数据问题

2019-04-21 11:50 246 查看

为了更好的达到数据的分类汇总功能,pandas也准备数据透视表功能
需要说明的是:index=代表行标签,columns=代表列标签,value=代表值标签,aggfunc=代表计算方式,len代表计数
可以多个行列标签,这就对应多维数据,aggfunc使用字典方式就是分别对不同的值采用不同的计算方式。


那更重要的是,我们创建了数据透视表,想要使用其中的数据怎么办,也就是说,我们该怎么引用呢。
我们首先看看数据的类型结构
有意思的是,数据透视表创建的数据是Dataframe,但是值得注意的是,因为我们的行列标签是多重的,因此数据透视表是个多维数据;类型,我们可以试着用引用其中一个数据看看。




我们查找索引位置是(0,0)的数据正好查找到29,说明是正确的
接下来我们用loc引用试试


我们的确得到了一个数据框,这容易理解,但是接下来如果我们想查找3c数码下的mean


我们们发现会报错,也就是说,我们利用loc不能直接索引第二层、第三层的数据
那应该怎么办呢,毕竟这是一个多维的数据,一个办法是多次loc,如我们要找以下数据,3c数码,年龄,内江市,mean,女的数据
就能得到正确的结果,注意,从外到内索引,即可。当然在多维数据索引之前,我们需要清楚各个维度的变量有什么。


这里只是介绍了多维数据的索引,那么如果要建立多维数据怎么办呢,目前网上没有过多的介绍,感兴趣的可以自己去研究哦,这里,了解数据透视表的多维结构即可,这样很多时候我们需要分类汇总,并要将其中的数据进一步处理的时候m,,就可以直接利用数据透视表分类汇总数据在取其中的数据就可以了。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐