您的位置：首页 > 其它

机器学习----Softmax回归

2016-04-30 16:59 288 查看

本篇博客主要是参考吴恩达教授的Ufldl教程，教程链接如下：

http://ufldl.stanford.edu/wiki/index.php/Softmax%E5%9B%9E%E5%BD%92

OK！开启，本次的学习之旅吧！

1、Softmax回归解决什么问题呢？

通过前面的学习，我们知道线性回归解决的连续值的预测，逻辑回归解决的是离散值的预测，而且针对二分类问题。那么问题来了，如果是离散值预测，但是是多类别预测，也就是有多个类别标签，这种情况怎么办呢？Softmax回归针对的就是这种问题。

2、Softmax回归的假设函数

还记得逻辑回归中的假设函数吗？不记得也没关系，逻辑归回的假设函数如下：

逻辑回归的假设函数借用了sigmoid函数，而且逻辑回归中有一个假设上式代表取类别1的概率，而取类别0的概率我们用1-h(x)表示。

在 softmax回归中，我们解决的是多分类问题（相对于 logistic 回归解决的二分类问题），类标

可以取

个不同的值（而不是 2 个）。因此，对于训练集

，我们有

。（注意此处的类别下标从 1 开始，而不是 0）。对于给定的测试输入

，我们想用假设函数针对每一个类别j估算出概率值

。也就是说，我们想估计

的每一种分类结果出现的概率。因此，我们的假设函数将要输出一个

维的向量（向量元素的和为1）来表示这

个估计的概率值。具体地说，我们的假设函数

形式如下：

其中

是模型的参数。请注意

这一项对概率分布进行归一化，使得所有概率之和为
1

个人注释：我们第一眼看到这个式子可能会感到很困惑，我觉得你的困惑很有可能是把Softmax函数的假设函数和sigmoid函数联系在一起了，觉得Softmax回归的假设函数和逻辑回归假设函数一样，借鉴了sigmoid函数。但是，这是错的，Softmax函数的假设函数并没有借鉴sigmoid函数，上面的假设函数的形式我们可以把它理解成一种普通的函数表达式就可以了。
3、代价函数

先给出Softmax的函数形式如下：