您的位置:首页 > 编程语言 > Python开发

7057-2.Python数据分析:统计与图表生成

2018-03-09 10:47 603 查看
这篇文章中我将简单介绍列表和文件中数据的统计
这里我们利用pandas中的value_countsimport matplotlib.pyplot as plt
import pandas as pd
s=(['a','b','b','b','c','a','b','c','a','a','b','b','b'])
f=open("train.csv")#打开一个数据文件,以泰坦尼克号生还数据为例
data=pd.read_csv(f)

print(pd.value_counts(s))#对于列表元素进行计数
print(pd.value_counts(data.Survived))#对于csv文件中一列数据进行计数
#或使用语句:print(data.Survived.value_counts())

输出样式如下:
b    7
a    4
c    2
dtype: int64
0    549
1    342
Name: Survived, dtype: int64
那么我们不妨试着用图表的方式表示出来:
ax1=plt.subplot2grid((1,2),(0,0))#生成一行两列的图表,该表位于(0,0)的位置
pd.value_counts(s).plot(kind='bar')#将计数结果通过绘制图表实现可视化
plt.title("Num of the letter")#设置图表标题
plt.ylabel("字母数量")#设置y轴标题

ax2=plt.subplot2grid((1,2),(0,1))
data.Survived.value_counts().plot(kind='bar')
ax1.set_xlim(-1,2)
plt.title("Distribution of Survival,(1=Survived)")
plt.ylabel("人数")
plt.show()
那么,就大功告成了
输出如下:



#附:plot的各类参数
#label 用于图例的标签
#style 将要传给matplotlib的字符串范式
#kind 可以是’line’:折线图;'bar’:柱状图; ‘barh’:条形图;‘kde’:密度分布图
#ax 要在其上进行绘制的matplotlib subplot对象,注:如果没有设置,则使用当前matplotlib subplot
#use_index 将对象的索引用作刻度标签
#rot 旋转刻度标签(0-360)
#alpha 图表不透明度设置,参数为0-1
#xticks 用作X轴刻度值(精确度)
#yticks 用作Y轴刻度值(精确度)
#xlim X轴的范围(函数的定义域)
#ylim Y轴的范围(值域或取值范围)
#grid 显示轴网格线
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  Python 数据分析