您的位置：首页 > 其它

机器学习算法（二）逻辑斯蒂回归

2017-07-24 22:37 218 查看

上文中说过，逻辑斯蒂回归虽然称为回归，但它实际上是一种分类算法。认识逻辑斯蒂回归，首先需要知道sigmoid函数。下面公式1即为sigmoid函数g(x)=11+e−x它的函数图像如图所示。

1、算法介绍

和上文中的回归算法一样，我们有m条数据，每条数据有n个特征和1个标签。不同的是，上文的标签是一个连续型变量，本文中的标签是一个离散型变量，且它只有两个值，[0,1]。

在线性回归中，有yˆ=θTx，而在逻辑斯蒂回归中，其结果就是在线性回归外面套上sigmoid函数，即yˆ=11+e−θTx因此，yˆ是一个连续变量，其取值范围为(0,1)。

对于y和yˆ,我们希望，当yˆ接近1时，y也大概率为1；当yˆ接近0时，y也大概率为0。因此可以做出如下假设。

p(y=1|x,θ)=yˆ p(y=0|x,θ)=1−yˆ

以上两式可以统一为P(y|x,θ)=yˆy(1−yˆ)1−y同理，由于x和y均已知，它是一个关于θ的函数。

据此可求出其最大似然函数：L(θ)=∏i=1myˆy(1−yˆ)1−y，i为第i个样本。

同理，可求其对数似然函数为l(θ)，并对每个θ求偏导。求导结果为：∂l(θ)∂θj=∑i=1m(yi−yˆi)xij

对其进行梯度上升学习，有

θj=θj+α(y−yˆ)xj

逻辑斯蒂回归的目标函数被习惯性的认为成对数似然函数的相反数，即loss=−l(θ)

前文中，我们认为y的取值为0，1。若认为y的取值为+1和-1，则可推导出一个较为优美的损失函数如下。loss=∑i=1m[ln(1+e−yiyˆi)]

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 机器学习算法

相关文章推荐

新的分享

章节导航