您的位置:首页 > 编程语言 > Python开发

Python数据可视化学习笔记:第一章 关联图 第二节 使用Python绘制多类别散点图

2020-04-01 12:44 429 查看

前言

声明:这个系列的博文都是我自己学习所得的东西,秉承着每天进步一点点的理念进行学习,我参考的课程是《菊安酱与菜菜的Python机器学习可视化50图》,使用的Python版本为3.6.4。
今天学习的内容是多类别散点图的绘制,之前我有用到过这样的图,主要是为了表达多阈值对地物的分离程度。我把这次的学习分为两种,第一种是无图例的,第二种是有图例的。

无图例的多类别散点图制作

区分的目的是多类别数据的散点图的图例生成较为复杂,,先从简单的入手。

#Author:Albert(CSDN:一个跻身科研大浪的小白)
#Time:2020/03/23
#usage:散点图

import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库

#2.无图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

plt.scatter(x[:,0],x[:,1],s=50,c=y)

plt.show()

看看效果:

此时基本出现了多类别散点图的效果,现在需要加入图例,使图片完整,如果按照简单的散点图的图例生成方法进行,会怎么样呢?大家可以尝试。

有图例的多类别散点图

思路:我们可以遍历每一个点的类别和颜色,然后生成不同类别的图例。
接下来,我来给出代码:

#Author:Albert(CSDN:一个跻身科研大浪的小白)
#Time:2020/03/23
#usage:散点图

import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库

#3.有图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

#要想生成两个图例,就要循环,分别循环颜色和标签

colors = ["red","black"]
labels=["Zero","One"]

for i in range(x.shape[1]):
plt.scatter(x[y==i,0],x[y==i,1],c=colors[i],label=labels[i])

#在标签中存在几种类别,我们就循环几次,一次画一个点
plt.legend()
plt.show()

来看看效果,已经达到了我们的效果:

完整代码

我会把每一期的代码都以注释的形式展示,这样慢慢增大知识库。

#Author:Albert(CSDN:一个跻身科研大浪的小白)
#Time:2020/03/23
#usage:散点图

import numpy as np #数学处理库
import pandas as pd #用于处理.csv excel html 文本等文件
import matplotlib as mpl #画图像的库
import matplotlib.pyplot as plt #画二维图像的库
import seaborn as sns #颜色库

#画散点图的函数plt.scatter()

'''#1.绘制一个简单的散点图:X1和X2之间的关系图

#定义数据
x1 = np.random.randn(10)#取10个随机数,其中random为随机数函数,randn为取的数是正态分布的数
x2 = x1+x1**2-10

#确定一个画布,当只有一个图可以不确定
plt.figure(figsize=(8,4))#第一条线是横的,第二条是竖的

#绘图
plt.scatter(x1,x2,s=20,c="blue",label="Positive")#(横纵坐标,点的尺寸大小,颜色,图例的名称可以不写)

#装饰图形
plt.legend()#显示图例

plt.show()#显示图形'''

'''#2.无图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

plt.scatter(x[:,0],x[:,1],s=50,c=y)

plt.show()'''

#3.有图例,分类型变量,即存在有两种数据,两列X对应一列y的情况
x = np.random.randn(10,2)#10行2列的数据集
y = np.array([0,0,1,1,0,1,0,1,0,0])#类别:假设目前有两种类型的数据分别是0和1

plt.figure(figsize=(8,4))

#要想生成两个图例,就要循环,分别循环颜色和标签

colors = ["red","black"]
labels=["Zero","One"]

for i in range(x.shape[1]):
plt.scatter(x[y==i,0],x[y==i,1],c=colors[i],label=labels[i])

#在标签中存在几种类别,我们就循环几次,一次画一个点
plt.legend()
plt.show()

练习:增强实用性

我们在进行实际操作时,不可能使用的是简单的随机数,而是我们的成果。下面就以一个实例增强代码的实用性,例如:有一个EXCLE表格中含有三个类型的变量,我们怎么生成这样的多类别散点图呢?
(下面的数据是我在做项目的真实数据所以不共享了,我对重要的部分做了隐藏,大家可以以自己的数据做实验)
效果先展示一下,答案明天给出:

思考

这样的代码对于类别较少的数据还可以自己纯手动敲,但是对于几十种类型呢?

  • 点赞
  • 收藏
  • 分享
  • 文章举报
一个跻身科研大浪的小白 发布了12 篇原创文章 · 获赞 4 · 访问量 1075 私信 关注
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐