您的位置：首页 > 编程语言 > Go语言

Generative learning algorithm

2016-03-28 10:08 344 查看

本讲大纲：

1.生成学习算法（Generative learning algorithm）

2.高斯判别分析（GDA，Gaussian Discriminant Analysis）

3.朴素贝叶斯（Naive Bayes）

4.拉普拉斯平滑（Laplace smoothing）

1.生成学习算法

判别学习算法（discriminative learning algorithm）:直接学习p(y|x)（比如说logistic回归）或者说是从输入直接映射到{0,1}.

生成学习算法（generative learning algorithm）:对p(x|y)（和p(y)）进行建模.

简单的来说，判别学习算法的模型是通过一条分隔线把两种类别区分开，而生成学习算法是对两种可能的结果分别进行建模，然后分别和输入进行比对，计算出相应的概率。

比如说良性肿瘤和恶性肿瘤的问题，对良性肿瘤建立model1（y=0），对恶性肿瘤建立model2（y=1），p(x|y=0)表示是良性肿瘤的概率,p(x|y=1)表示是恶性肿瘤的概率.

根据贝叶斯公式（Bayes rule）推导出y在给定x的概率为：

2.高斯判别分析

GDA是我们要学习的第一个生成学习算法.

GDA的两个假设：

假设输入特征x∈Rn，并且是连续值;
p(x|y)是多维正态分布（multivariate normal distribution）;
2.1 多维正态分布

若x服从多维正态分布（也叫多维高斯分布），均值向量（mean vector）

，协方差矩阵（convariance matrix）

，写成x~

,
其密度函数为：

表示行列式（determinant）.

均值：

协方差Cov(Z)=

= ∑

高斯分布的一些例子：

左图均值为零（2*1的零向量），协方差矩阵为单位矩阵I（2*2）（成为标准正态分布）.

中图协方差矩阵为0.6I，

右图协方差矩阵为2I

均值为0，方差分别为：

2.2 高斯判别分析模型

写出概率分布：

模型的参数为φ，μ0，μ1，∑，对数似然性为：

求出最大似然估计为：

结果如图所示：

1.3 讨论GDA和logistic回归

GDA模型和logistic回归有一个很有意思的关系.

如果把

看做是x的函数，则有：

其中

是

的函数，这正是logistic回归的形式.

关于模型的选择：

刚才说到如果p(x|y)是一个多维的高斯分布，那么p(y|x)必然能推出一个logistic函数；反之则不正确，p(y|x)是一个logistic函数并不能推出p(x|y)服从高斯分布.这说明GDA比logistic回归做了更强的模型假设.

如果p(x|y)真的服从或者趋近于服从高斯分布，则GDA比logistic回归效率高.
当训练样本很大时，严格意义上来说并没有比GDA更好的算法（不管预测的多么精确）.
事实证明即使样本数量很小，GDA相对logisic都是一个更好的算法.
但是，logistic回归做了更弱的假设，相对于不正确的模型假设，具有更好的鲁棒性（robust）.许多不同的假设能够推出logistic函数的形式. 比如说，如果