您的位置:首页 > 其它

pandas入门——数据分组

2017-08-02 18:19 211 查看

数据分组

数据的导入

f = pd.read_csv("D://NBA.csv", encoding="gbk")
print(type(f))
print(f.shape)
# 按条件进行分组
g1 = f.groupby(by=list(["collage"]))
print(type(g1))
print(g1)


获取分组数据的第一行

print(g1.first())


获取每组的个数

print(g1.size())


获取每一组的描述信息

print(g1.describe())


查看每一组在样本数据中所有的索引位置

print(g1.groups)


选择具体的分组

print(g1.get_group("University of Wisconsin"))


对分组数据进行迭代

for name, group in g1:
print(name)
print("-".center(50, "-"))
print(group.shape)


将函数应用到分组数据上

print(g1.aggregate(numpy.sum))
print(g1.aggregate(numpy.mean))


在不同的分组列上应用不同的分组函数

print((g1.aggregate({"height": numpy.sum, "weight": numpy.mean})).rename(columns={"height": "求和", "weight": "平均数"}))
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  pandas