您的位置:首页 > 其它

数据可视化

2020-08-26 11:35 62 查看

数据可视化

导入所需要的库

使用import命令导入numpy、pandas以及matplotlib三个库,用来做数据分析以及数据可视化。
使用pandas库的read_csv(‘文件名称’)读入csv文件,并使用 .head()函数在编译器中显示部分数据。

若想具体了解matplotlib库的使用规则以及函数名称,可以参照管网对应的使用手册

可视化展示泰坦尼克号数据集中男女中生存人数分布情况

  1. sex = text.groupby(‘Sex’)[‘Survived’].sum()
    此函数使用.groupby()函数以性别sex分类求sex中属性为Survived的人数并使用.sum()函数求和。
  2. sex.plot.bar() 将sex数组使用plot()函数画图并以柱状图Bar的形式表示出来。
  3. plt.title(‘survived_count’)以及plt.show()为指定上述图形的标题名称以及使用.show()函数将图标显示出来。

可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图

  1. text.groupby([‘Sex’,‘Survived’])[‘Survived’].count().unstack().plot(kind=‘bar’,stacked=‘True’)
    Sex为分类依据,查找不同Sxe中的Survived属性的人数并使用.count()函数累计求和,图标的形式为Bar柱状图,并使用stacked属性进行同一柱状图数据的累加。
  2. plt.ylabel(‘count’) 为y轴图例并将其指定为‘count’

可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况

fare_sur = text.groupby([‘Fare’])[‘Survived’].value_counts().sort_values(ascending=False);

  1. Sex为分类依据,查找不同Sxe中的Survived属性的人数,并以升序的排序方式进行显示。若ascending=True,则按照降序的方式进行排序。
  2. fig = plt.figure(figsize=(20, 18));fare_sur.plot(grid=True);plt.legend();plt.show()
    使用figure()函数画图,图形的尺寸为长20宽18;将上述数据在该图形中显示出来,并加入网格线(即网格命令grid=True);legend()函数为显示图例名称。
  3. 在数据排序后再进行可视化可以更加准确分析数据的整体趋势与变化情况,可视化效果更加突出。

可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况

  1. import seaborn as sns 导入seaborn库,进行数据可视化分析
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: