您的位置：首页 > 其它

lda的变分推理

2016-01-29 15:35 218 查看

上文， lda 原理及变形，我们提到 e-step 我们要用变分推理的方法求解如下的优化问题：

所以，这里用了其他的方法来求解。
我们提到的函数可以转化为log似然函数。根据逻辑似然函数的jesen 不等式性质，我们可以找到 log似然函数的下界。

（1）

Jensen不等式是指，积分的凸函数值大于等于凸函数的积分值：

ϕ(E(X))≤E(ϕ(X))

将（1）式中的第四行标记为

，这个就是log似然函数的下边界，我们计算
二者的差发现刚好是这两个的分布的kl距离。

所以原来的kl最小转化成了

最大化，下面是用拉格朗日乘数法求取L最大值问题。

根据狄利克雷分布的一个性质：

可以计算以上的五个期望：

我们对(2)式中的L做简化，只留下与ϕ 有关的项
：

求偏导：

解得：

对于
gamma

，同样的步骤：

也就是让括号中的

为 0.

M-step ：

拉格朗日乘数法求解β

首先把L(γ,ϕ;α,β)简化，只保留与β有关的部分。因为β是每一行存一个主题的词分布，所以每一行的和是1，存在等式约束∑Vj=1βij=1，所以是带等式约束的最大化问题，使用拉格朗日乘数法，可得到拉格朗日函数如下：

牛顿法求解 alpha

参考：

《Latent Dirichlet Allocation》
http://blog.csdn.net/happyer88/article/details/46473497
的差发现刚好

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航