您的位置：首页 > 其它

pandas入门——数据分组

2017-08-02 18:19 211 查看

数据分组

数据的导入

f = pd.read_csv("D://NBA.csv", encoding="gbk")
print(type(f))
print(f.shape)
# 按条件进行分组
g1 = f.groupby(by=list(["collage"]))
print(type(g1))
print(g1)

获取分组数据的第一行

print(g1.first())

获取每组的个数

print(g1.size())

获取每一组的描述信息

print(g1.describe())

查看每一组在样本数据中所有的索引位置

print(g1.groups)

选择具体的分组

print(g1.get_group("University of Wisconsin"))

对分组数据进行迭代

for name, group in g1:
print(name)
print("-".center(50, "-"))
print(group.shape)

将函数应用到分组数据上

print(g1.aggregate(numpy.sum))
print(g1.aggregate(numpy.mean))

在不同的分组列上应用不同的分组函数

print((g1.aggregate({"height": numpy.sum, "weight": numpy.mean})).rename(columns={"height": "求和", "weight": "平均数"}))

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： pandas

相关文章推荐

新的分享

章节导航