您的位置:首页 > 其它

概率图模型学习(一):概率图矩阵分解

2016-07-30 09:40 211 查看
最近在学习概率图模型,将所学知识根据自己的理解分享一下,因为初学,如果理解不到位,或者太简单,望理解。

概率矩阵分解(probabilistic matrix factorization)

建模与表示



实际上就是将R矩阵分解为U,V矩阵的乘积,假设R,U,V都是服从正态分布,并作以下假设即:

Rij∼N(UTiVj,σ2)Ui∼N(0,σ2UI)Vj∼N(0,σ2VI)

统计推断

这里运用最大后验概率推理,和极大似然估计挺像,只不过是对后验概率的最大化,实际上也是一种点估计的方法,运用贝叶斯公式:

P(U,V|R)∼P(U)P(V)P(R|U,V)

为了清楚表示,省略了超参数的表示(σ2,σ2U,σ2V),实际上根据贝叶斯公式应该是:

P(U,V|R)=P(U)P(V)P(R|U,V)P(R)

但P(R)和我们要得到的U,V,在进行统计推断时可以忽略。对后验概率取log得到损失函数:

logP(U,V|R)=logP(U)+logP(V)+logP(R|U,V)+C

然后根据朴素贝叶斯假设

logP(U)logP(V)logP(R|U,V)=∑i=1N(UTiUi2σ2U)+CU=∑i=1M(VTiVi2σ2V)+CV=∑i=1N∑i=1MIij2σ2(Rij−UTiVj)2+CR

这里的CU,CV,CR都是常数,因此得到:

E=12∑i=1N∑i=1MIij(Rij−UTiVj)2+λU2∑i=1N∥Ui∥2+λV2∑i=1M∥Vi∥2

然后惊讶的发现,这不就是矩阵分解的目标函数嘛。进一步可以看到,如果直接用极大似然估计,而不是最大后验概率,那得到的就是上面公式等式右边第一项,即没有正则化项,所以为何贝叶斯学习可以有效防止过拟合,道理就在这里
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  统计学习