您的位置：首页 > 编程语言 > Python开发

【EM算法】在高斯混合模型中的应用及python示例

2017-03-23 15:04 447 查看

一、EM算法

EM算法是一种迭代算法，用于含有隐含变量的概率模型参数的极大似然估计。设Y为观测随机变量的数据，Z为隐藏的随机变量数据，Y和Z一起称为完全数据。

观测数据的似然函数为：

模型参数θ的极大似然估计为：

这个问题只有通过迭代求解，下面给出EM算法的迭代求解过程：

step1、选择合适的参数初值θ(0)，开始迭代

step2、E步，求期望。θ(i)为第i次迭代θ的估计值，在第i+1步，计算下面的Q函数：

Q函数为logP(Y,Z|θ)关于在给定观测数据Y和当前参数θ(i)下对隐藏变量Z的条件概率分布P(Z|Y,θ(i))的期望。

step3、M步，求极大化。求使Q函数极大化的θ，确定第i+1次迭代的参数估计：

step4、重复第2、3步，直到收敛。

EM算法对初值的选取比较敏感，且不能保证找到全局最优解。

二、在高斯混合模型（GMM）中的应用

一维高斯混合模型：

多维高斯混合模型：

wk（k=1，2，……，K）为混合项系数，和为1。∑为协方差矩阵。θ=（wk，uk，σk）。

设有N个可观测数据yi，它们是这样产生的：先根据概率wk选择第k个高斯分布模型，生成观测数据yi。yi是已知的，但yi属于第j个模型是未知的，是隐藏变量。用Zij表示隐藏变量，含义是第i个数据属于第j个模型的概率。先写出完全数据的似然函数，然后确定Q函数，要最大化期望，对wk、uk、σk求偏导并使其为0。可得高斯混合模型参数估计的EM算法（以高维数据为例）：

step1、参数赋初始值，开始迭代

step2、E步，计算混合项系数Zij的期望E[Zij]：

step3、M步，计算新一轮迭代的参数模型：

step4、重复第2、3步，直到收敛。

三、python程序示例

此示例程序随机从4个高斯模型中生成500个2维数据，真实参数：混合项w=[0.1，0.2，0.3，0.4]，均值u=[[5，35]，[30，40]，[20，20]，[45，15]]，协方差矩阵∑=[[30，0]，[0，30]]。然后以这些数据作为观测数据，根据EM算法来估计以上参数（此程序未估计协方差矩阵）。源代码如下：

import math
import copy
import numpy as np
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D

#生成随机数据，4个高斯模型
def generate_data(sigma,N,mu1,mu2,mu3,mu4,alpha):
global X #可观测数据集
X = np.zeros((N, 2)) # 初始化X，2行N列。2维数据，N个样本
X=np.matrix(X)
global mu #随机初始化mu1，mu2，mu3，mu4
mu = np.random.random((4,2))
mu=np.matrix(mu)
global excep #期望第i个样本属于第j个模型的概率的期望
excep=np.zeros((N,4))
global alpha_ #初始化混合项系数
alpha_=[0.25,0.25,0.25,0.25]
for i in range(N):
if np.random.random(1) < 0.1: # 生成0-1之间随机数
X[i,:] = np.random.multivariate_normal(mu1, sigma, 1) #用第一个高斯模型生成2维数据
elif 0.1 <= np.random.random(1) < 0.3:
X[i,:] = np.random.multivariate_normal(mu2, sigma, 1) #用第二个高斯模型生成2维数据
elif 0.3 <= np.random.random(1) < 0.6:
X[i,:] = np.random.multivariate_normal(mu3, sigma, 1) #用第三个高斯模型生成2维数据
else:
X[i,:] = np.random.multivariate_normal(mu4, sigma, 1) #用第四个高斯模型生成2维数据

print("可观测数据：\n",X) #输出可观测样本
print("初始化的mu1，mu2，mu3，mu4：",mu) #输出初始化的mu

def e_step(sigma,k,N):
global X
global mu
global excep
global alpha_
for i in range(N):
denom=0
for j in range(0,k):
denom += alpha_[j]*math.exp(-(X[i,:]-mu[j,:])*sigma.I*np.transpose(X[i,:]-mu[j,:]))/np.sqrt(np.linalg.det(sigma)) #分母
for j in range(0,k):
numer = math.exp(-(X[i,:]-mu[j,:])*sigma.I*np.transpose(X[i,:]-mu[j,:]))/np.sqrt(np.linalg.det(sigma)) #分子
excep[i,j]=alpha_[j]*numer/denom #求期望
print("隐藏变量：\n",excep)

def m_step(k,N):
global excep
global X
global alpha_
for j in range(0,k):
denom=0 #分母
numer=0 #分子
for i in range(N):
numer += excep[i,j]*X[i,:]
denom += excep[i,j]
mu[j,:] = numer/denom #求均值
alpha_[j]=denom/N #求混合项系数

if __name__ == '__main__':
iter_num=1000 #迭代次数
N=500 #样本数目
k=4 #高斯模型数
probility = np.zeros(N) #混合高斯分布
u1=[5,35]
u2=[30,40]
u3=[20,20]
u4=[45,15]
sigma=np.matrix([[30, 0], [0, 30]]) #协方差矩阵
alpha=[0.1,0.2,0.3,0.4] #混合项系数
generate_data(sigma,N,u1,u2,u3,u4,alpha) #生成数据
#迭代计算
for i in range(iter_num):
err=0 #均值误差
err_alpha=0 #混合项系数误差
Old_mu = copy.deepcopy(mu)
Old_alpha = copy.deepcopy(alpha_)
e_step(sigma,k,N) # E步
m_step(k,N) # M步
print("迭代次数:",i+1)
print("估计的均值:",mu)
print("估计的混合项系数:",alpha_)
for z in range(k):
err += (abs(Old_mu[z,0]-mu[z,0])+abs(Old_mu[z,1]-mu[z,1])) #计算误差
err_alpha += abs(Old_alpha[z]-alpha_[z])
if (err<=0.001) and (err_alpha<0.001): #达到精度退出迭代
print(err,err_alpha)
break
#可视化结果
# 画生成的原始数据
plt.subplot(221)
plt.scatter(X[:,0], X[:,1],c='b',s=25,alpha=0.4,marker='o') #T散点颜色，s散点大小，alpha透明度，marker散点形状
plt.title('random generated data')
#画分类好的数据
plt.subplot(222)
plt.title('classified data through EM')
order=np.zeros(N)
color=['b','r','k','y']
for i in range(N):
for j in range(k):
if excep[i,j]==max(excep[i,:]):
order[i]=j #选出X[i,:]属于第几个高斯模型
probility[i] += alpha_[int(order[i])]*math.exp(-(X[i,:]-mu[j,:])*sigma.I*np.transpose(X[i,:]-mu[j,:]))/(np.sqrt(np.linalg.det(sigma))*2*np.pi) #计算混合高斯分布
plt.scatter(X[i, 0], X[i, 1], c=color[int(order[i])], s=25, alpha=0.4, marker='o') #绘制分类后的散点图
#绘制三维图像
ax = plt.subplot(223, projection='3d')
plt.title('3d view')
for i in range(N):
ax.scatter(X[i, 0], X[i, 1], probility[i], c=color[int(order[i])])
plt.show()
结果如下：
混合项系数估计为[0.46878064954123966, 0.087906620835838722, 0.25716577653788636, 0.18614695308503548]

均值估计为[[ 45.20736093 15.47819894]

[ 3.74835753 34.93029857]

[ 19.97541696 20.26373867]

[ 29.91276386 39.87999686]]

左上图为生成的观测数据，右上图为分类后的结果，下图为高斯混合模型的三维可视化图。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 高斯混合模型 EM算法机器学习

相关文章推荐

新的分享

章节导航