您的位置:首页 > 其它

【机器学习】Random Forest(随机森林)入门和实战(二)它是个什么东西(What)

2017-02-14 13:23 405 查看
我对机器学习模型的学习方法分为三点:学会如何使用(how),扫盲式的了解它是个什么东西(What),以及什么时候使用(when)。

定义

RF是用来处于 分类 问题和 回归 问题的通用性模型,属于 集成学习(Ensemble) 的一种。(什么是集成学习?画上问号,后几篇文章解释)

关键词

森林

我知道你想的是这样:



没错就是这样,所以核心就是每棵树:
- 是什么:不同模型的决策树 (Decision Tree)(这是什么?以后解释,不影响现在理解。)
- 有什么用:每棵树都从训练总体样本M中随机抽取m个样本进行决策,得到决策结果。


随机

每科树都是从训练总体样本M中随机抽取m个样本。

结果处理

由于每棵树所用模型都不同,所以树们的结果有好有坏,如何得到我想要的好结果?

方法就是:投票。

将所有决策树的结果进行投票(别问我怎么是进行投票的),反正最后得到我想要的结果。

参考资料

随机森林扫盲

[机器学习基础] 随机森林算法

我的相关文章

【机器学习】Random Forest(随机森林)入门和实战(一)先写个项目

【机器学习】Random Forest(随机森林)入门和实战(三)什么时候使用
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  机器学习 random forest