您的位置:首页 > 编程语言 > PHP开发

[转]用Matplotlib绘制 折线图 散点图 柱状图 圆饼图

2015-07-02 14:14 1026 查看
Matplotlib是一个Python工具箱,用于科学计算的数据可视化。借助它,Python可以绘制如Matlab和Octave多种多样的数据图形。

安装

Matplotlib并不是Python的默认组件,需要额外安装。

官方下载地址 http://matplotlib.org/downloads.html

必须下载与自己的Python版本,操作系统类型对应的安装包。如Windows 64位+Python3.3,应该下载matplotlib-1.3.1.win-amd64-py3.3.exe

第一个程序

让我们运行第一个Matplotlib程序:

import matplotlib.pyplot as plt
plt.plot([1, 2, 3])
plt.ylabel('some numbers')
plt.show()


如果Matplotlib已经正确安装,您将会看到如下结果:





这个弹出窗口就是Matplotlib的绘图输出窗口,底部从左到右有七个按钮:

重置视图,显示最初的视图

上一个视图

下一个视图

移动工具,用于拖动绘图的显示区域

缩放工具,可以拖拽一个矩形缩放到窗口大小

配置工具,调整绘图选项

保存图片

接下来我们一起分析这个短小的程序代码。

第1行:

import matplotlib.pyplot as plt


调用matplotlib的pyplot绘图工具,之后我们就可以使用plt代替matplotlib.pyplot使用了。

第2行:

plt.plot([1, 2, 3])


绘制一个折线图。plot()方法用于绘制折线图,pyplot还有绘制柱状图、饼图的方法。[1,2,3]是Y坐标,而缺省的X坐标为[0,1,2]。两个一维数组X和Y构成了折线关键点的坐标(0,1),(1,2),(2,3)。您可以尝试修改参数如:

plt.plot([0, 1, 2, 3], [0.1, 0.2, 0.15, 0.3]) # 第一个数组是X坐标,第二个数组是Y坐标


第3行:

plt.ylabel('some numbers')


为Y坐标轴添加标签,通常用以标注此变量的名称和单位。当然X轴也是可以添加标签的:

plt.xlabel('Time (s)')
plt.ylabel('Speed (m/s)')


第4行:

plt.show()


显示绘图窗口。在绘图完成之后,我们要调用这个方法才能打开绘图输出窗口。

另一种图形输出方式是保存图片,缺点是不能使用缩放、移动等交互浏览功能:

plt.save('output.png')


基本绘图

折线图和散点图-plot()

plot()函数可以绘制折线图和折线图,取决于您使用的参数。

数据和坐标

一个最简单的例子:

import matplotlib.pyplot as plt

x = [0, 1, 2, 3, 4, 5]
y = [0.1, 0.2, 0.2, 0.3, 0.2, 0.1]

plt.plot(x, y)

plt.show()


绘制折线图/散点图需要一系列关键点。x是关键点的x轴坐标,y是关键点的y轴坐标。

xy
00.1
10.2
20.2
30.3
40.2
50.1
未附加额外参数时,将绘制最基本的折线图:





x轴坐标是可以缺省的:

plot(y)


y是一个一维数组,是折线图关键点的y轴坐标。而x轴坐标没有给出,会默认以[0,1,2,...]的常数列作为x轴坐标。

样式

散点图和折线图只是线条样式的差异,我们可以通过简单的参数设置线条的样式和颜色。样式和颜色参数都是一个或多个字符构成的字符串。

既可以单独设定颜色或样式,如'g'代表绿色,'-'代表实线

也可以同时设定样式和颜色,比如'--g'代表绿色虚线,其中'--'代表虚线,'g'代表绿色

样式字符串中的参数字符是无顺序的,'g--'和'--g'的意义是相同的

也可以同时设定折线和散点,如'-or'代表红色实线+圆圈

例子:

import matplotlib.pyplot as plt

x = [0, 1, 2, 3, 4, 5]
y = [0.1, 0.2, 0.2, 0.3, 0.2, 0.1]

plt.plot(x, y, '-or')

plt.show()






折线样式:

参数样式
'-'实线
'--'虚线
'-.'线-点
':'点虚线
散点样式:

参数样式
'.'实心点
'o'圆圈
','一个像素点
'x'叉号
'+'十字
'*'星号
'^' 'v' '<' '>'三角形(上下左右)
'1' '2' '3' '4'三叉号(上下左右)
颜色:

参数颜色
'b'
'g'绿
'r'
'c'
'm'品红
'y'
'k'
'w'
更多样式参见 http://matplotlib.org/api/pyplot_api.html#matplotlib.pyplot.plot

您也可以不必使用样式字符串,而直接使用参数名,这种方式更加灵活:

plot(x, y, color='green', linestyle='dashed', marker='o', markerfacecolor='blue', markersize=12)


多条线

我们可以在一个坐标中绘制多条折线或散点,plot(第一条线的参数,第二条线的参数...):

import matplotlib.pyplot as plt

x = [0, 1, 2, 3, 4, 5]
y = [0.1, 0.2, 0.2, 0.3, 0.2, 0.1]
y2 = [0.2, 0.2, 0.3, 0.2, 0.3, 0]

plt.plot(x, y, 'b', x, y2, 'g')

plt.show()






柱状图-bar()

bar()函数可以绘制各种样式的柱状图,barh()则可绘制水平方向的柱状图。两个方法除了绘图方向外,其他属性和用法的是相同的。

数据和坐标

bar()至少需要两个数组left和height:left是每个柱向左到坐标原点的距离;height是每个柱的高度。

import matplotlib.pyplot as plt

left = [0, 1, 2, 3, 4, 5]
height = [0.1, 0.2, 0.2, 0.3, 0.2, 0.1]

plt.bar(left, height)

plt.show()






样式

bar()函数的参数可以控制柱状图的多种样式,最常用的有:

width,第3个参数,柱的宽度。可以是一个常数或数组。数组将对每条柱设定不同的值。

bottom,第4个参数,柱底部的y轴坐标。可以是一个常数或数组。数组将对每条柱设定不同的值。

color,关键字参数,柱的填充颜色。可以是一个常数或数组。数组将对每条柱设定不同的值。

edgecolor,关键字参数,柱的边框颜色。

linewidth,关键字参数,边框宽度。

xerr,yerr,关键字参数,x和y轴误差线。

ecolor,关键字参数,误差线颜色。

提示以上参数都可以是一个常数或数组。常数为所有柱设定相同的值,数组将对每条柱设定不同的值。
align,关键字参数,设定柱的对齐方式。'edge'将x坐标设为左边界,'center'将x坐标设为中轴线。

下面的柱状图要表达一件商品12个月的销量:

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
sales = [112, 105, 111, 109, 103, 110, 113, 112, 108, 106, 111, 114]

plt.bar(month, sales, 0.5, color='y', edgecolor='g', linewidth=3, align='center')

plt.show()


我们设置柱宽度0.5,填充颜色'y'(黄色),边框颜色'g'(绿色),线框宽度3,对齐方式为'center'





为了让销量变化看起来更明显,我们现在只绘出100以上的部分:

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
sales = [12, 5, 11, 9, 3, 10, 13, 12, 8, 6, 11, 14]

plt.bar(month, sales, 0.5, 100, color='y', edgecolor='g', linewidth=3, align='center')

plt.show()


我们添加了新的参数,设置柱状图的底部为100,而sales数据则减去100。





现在我们想将四个季度用颜色区分出来:

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
sales = [12, 5, 11, 9, 3, 10, 13, 12, 8, 6, 11, 14]
colors = ['g', 'g', 'g', 'm', 'm', 'm', 'y', 'y', 'y', 'c', 'c', 'c']

plt.bar(month, sales, 0.5, 100, color=colors, linewidth=0, align='center')

plt.show()


我们用一个数组来存储每个柱的颜色,其长度必须与month和sales相同。





多段柱图和水平柱图

绘制多段柱图的原理是:先后绘制多张柱图,依次重叠在上方,如果后面绘制的柱图比前者的柱图短,就可以显示出前者长出的部分。

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

bar1 = plt.bar(month, profit, 0.5, color='y', linewidth=0, align='center')
bar2 = plt.bar(month, cost, 0.5, color='g', linewidth=0, align='center')

plt.legend( (bar1[0], bar2[0]), ('Profits', 'Costs') )

plt.show()


我们还是用了legend()方法标识两段柱图的图例。legend()的更多用法见#绘图样式一节。





最后,让我们来绘制一个水平柱图,只需将bar()替换成barh():

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

bar1 = plt.barh(month, profit, 0.5, color='y', linewidth=0, align='center')
bar2 = plt.barh(month, cost, 0.5, color='g', linewidth=0, align='center')

plt.legend( (bar1[0], bar2[0]), ('Profits', 'Costs') )

plt.show()






圆饼图-pie()

pie()是绘制饼图的函数。

数据

pie()最基本的输入数据是一个数组。它可以根据数组元素的比例绘制扇形,因此不必要事先计算好百分比。

import matplotlib.pyplot as plt

rate = [1, 7, 3, 9]

plt.pie(rate)

plt.show()






样式

有几个最常用的参数可以控制绘图样式:

colors - 数组,扇形颜色

explode - 数组,扇形偏离圆心的距离

labels - 数组,扇形的标签

首先,让我们为饼图设定颜色,并让第三个扇形抽离出来:

import matplotlib.pyplot as plt

rate = [1, 7, 3, 9]
explode = [0, 0, 0.1, 0]
colors = ['c', 'm', 'y', 'g']

plt.pie(rate, explode=explode, colors=colors)

plt.show()






然后,要为每个扇形添加标签:

import matplotlib.pyplot as plt

rate = [1, 7, 3, 9]
explode = [0, 0, 0.1, 0]
colors = ['c', 'm', 'y', 'g']
labels = ['Apple', 'Pear', 'Peach', 'Orange']

plt.pie(rate, explode=explode, colors=colors, labels=labels)

plt.show()






百分比

如何显示百分比数值呢?我们需要使用autopct参数:

None,不显示百分比

格式字符串,如'%d percent',显示“40 percent”形式的百分比

方法,调用方法输出百分比

import matplotlib.pyplot as plt

rate = [1, 7, 3, 9]
explode = [0, 0, 0.1, 0]
colors = ['c', 'm', 'y', 'g']
labels = ['Apple', 'Pear', 'Peach', 'Orange']

plt.pie(rate, explode=explode, colors=colors, labels=labels, autopct='%d%%')

plt.show()


autopct='%d%%'表示我们将百分比以整数(%d)形式输出,后缀是百分号'%'。在格式化字符串中,百分号要用'%%'转义字符表示。





绘图样式

这一节介绍如何为图表添加标题,刻度,标签,图例,注释等元素,让图表更加清晰易懂。

标题-title()

title()方法用于绘制图表标题,一般位于顶部。最简单的方法是使用title('title'),绘制默认格式的标题文本。

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

plt.barh(month, profit, 0.5, color='y', linewidth=0, align='center')
plt.barh(month, cost, 0.5, color='g', linewidth=0, align='center')

plt.title('Sales Statistics')

plt.show()


若只想设置水平对齐,可以直接使用loc参数:

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

plt.barh(month, profit, 0.5, color='y', linewidth=0, align='center')
plt.barh(month, cost, 0.5, color='g', linewidth=0, align='center')

plt.title('Sales Statistics', loc='right')

plt.show()






您也可以额外使用fontdict参数定义格式,fontdict是一个字典数据(dict),有以下字段

'fontsize': 字体大小

'verticalalignment': 垂直对齐

'horizontalalignment': 水平对齐

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

plt.barh(month, profit, 0.5, color='y', linewidth=0, align='center')
plt.barh(month, cost, 0.5, color='g', linewidth=0, align='center')

font = {'fontsize': 22, 'verticalalignment': 'bottom', 'horizontalalignment': 'center'}
plt.title('Sales Statistics', fontdict=font)

plt.show()






刻度-xticks()&yticks()

xticks()和yticks()会修改默认的x轴y轴刻度。

继续上一个例子,现在我们将要把y轴的刻度从1,2,3...换成月份Jan,Feb,Mar...

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

plt.barh(month, profit, 0.5, color='y', linewidth=0, align='center')
plt.barh(month, cost, 0.5, color='g', linewidth=0, align='center')

plt.title('Sales Statistics')
ticks = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
plt.yticks(month, ticks)

plt.show()


yticks()有两个参数,第一个数组是每个刻度的位置,第二个数组是各个刻度。两个数组等长,设定某刻度的值应该定位于何处。





标签-xlabel()&ylabel()

接下来,添加x轴和y轴的标签:

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

plt.barh(month, profit, 0.5, color='y', linewidth=0, align='center')
plt.barh(month, cost, 0.5, color='g', linewidth=0, align='center')

plt.title('Sales Statistics')
ticks = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
plt.yticks(month, ticks)
plt.xlabel('Money (10000RMB)')
plt.ylabel('Month')

plt.show()






图例-legend()

因为有多段柱图,黄色和绿色,我们需要图例区分它们的含义:

import matplotlib.pyplot as plt

month = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]
cost = [8, 7, 9, 9, 3, 10, 10, 12, 8, 6, 11, 10]
profit = [12, 11, 11, 13, 5, 11, 13, 15, 10, 9, 12, 13]

bar1 = plt.barh(month, profit, 0.5, color='y', linewidth=0, align='center')
bar2 = plt.barh(month, cost, 0.5, color='g', linewidth=0, align='center')

plt.title('Sales Statistics')
ticks = ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec']
plt.yticks(month, ticks)
plt.xlabel('Money (10000RMB)')
plt.ylabel('Month')
plt.legend( (bar1[0], bar2[0]), ('Profits', 'Costs') )

plt.show()


legend()有两个数组参数:第一个是样式对象,比如这里选了bar1的第1个柱,bar2的第1个柱(如果是折线图则是某一点的样式);第二个是描述字符,对应描述每一个样式。





子图-subplot()

使用subplot()替代plot,可以在同一画布里绘制多个图表,它们的数量,大小都是可调的。

绘制图片

三维绘图

参考资源

官方网站

Python图表绘制:matplotlib绘图库入门 博客

使用 python Matplotlib 库绘图 博客

源文:http://xuexiii.org/index.php/Matplotlib
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: