您的位置:首页 > 其它

GBDT-沿着梯度提升的决策树

2016-11-01 11:17 232 查看
注:本文中所有公式和思路来自于李航博士的《统计学习方法》一书,我只是为了加深记忆和理解写的本文。





在上一篇文章中,介绍了基于残差的提升树,采用加法模型和前向分布算法,损失函数为平方损失,优化过程比较容易,但对于一般的损失函数,可能不会这么容易,因此提出了梯度提升的算法。利用的是最速下降法的近似方法,其关键是利用损失函数的负梯度在当前模型的值



作为回归提升树中的残差近似值,拟合一棵决策树。

具体算法如下:















其中需要解释几个与提升树的不同之处,在第一步中,我们本来应该是y与预测值y~的差值,这里设f(0)为常数,y~=c*f(0),所以统一划归为c中(其实f(0)可以通过求导消掉,我们姑且理解为划归入c中)。在第(2)(a)步中,损失函数对f(x)求偏导计算出损失函数的负梯度在当前模型的值,将它作为残差的近似(伪残差),第(2)(b)步中,估计回归树叶节点区域,用来拟合残差的近似值,第(2)(c)步用线性搜索方式估计叶节点区域的值,使得损失函数极小化,最后一步(d)更新回归提升树。





[b]基于残差的提升树
[/b]
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  提升 机器学习 算法