您的位置:首页 > 其它

【LDA】LDA主题模型

2017-12-23 18:01 204 查看
LDA是一个概率生成模型。认为文档是由词袋中的词按一定概率生成。对于语料集中的每篇文档,其生成过程是:
首先,从文档的所有主题分布中选取一个主题,这个过程服从所有主题的多项式分布。同时文档所有主题服从Dirichlet分布。
其次,从选取的主题中选取一个词,这个过程也是服从多项式分布。
重复上面的操作,这样一篇文档就生成了。再重复文档的生成过程,一个文档集也就生成。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: