您的位置:首页 > 其它

Logistic regression为什么不用Square error做loss function?

2017-08-30 21:37 1036 查看
假设训练样本为(xi,yi),f(xi)=11+exp(−(wx+b))

采用类似Linear regression的损失函数Square error:12∑ni=1l(f(xi)−yi)2

那么令其对w求导,得到以下

12∑i=1n∂l(f(xi)−yi)∂w=12∑i=1n2l(f(xi)−yi)∂f(xi)∂w=12∑i=1n2l(f(xi)−yi)∂f(xi)∂z∂z∂w=12∑i=1n2l(f(xi)−yi)f(xi)(1−f(xi))xi

所以,

yi=0时,若f(xi)=0,则上式为0,符合loss;若f(xi)=1,则上式也为0,不符合loss;

yi=1时,若f(xi)=1,则上式为0,符合loss;若f(xi)=0,则上式也为0,不符合loss;

再看看用suqare error和cross entropy做loss function的loss surface (图片来自台大李宏毅老师课件)

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  损失函数