决策树归纳一般框架(ID3,C4.5,CART)
2014-12-31 10:02
176 查看
感性认识决策树
构建决策树的目的是对已有的数据进行分类,得到一个树状的分类规则,然后就可以拿这个规则对未知的数据进行分类预测。
决策树归纳是从有类标号的训练元祖中学习决策树。
决策树是一种类似于流程图的树结构,其中每个内部节点(非树叶结点)表示一个属性上的测试,每个分支代表该测试上的一个输出,而每个树叶结点(或终端结点)存放一个类标号。树的最顶层结点是根结点。一个典型的决策树如下图所示,
该决策树是通过下表所示的训练元组和它们对应的类标号得到的,
为什么决策树如此流行
决策树分类器的构造不需要任何领域知识或参数设置,因此适合于探测式知识发现。决策树可以处理高维数据。获取的知识用树的形式表示是直观的,并且容易被人理解。决策树归纳的学习和分类步骤是简单和快速的。一般而言,决策树分类器具有很好的准确率。然而,成功的使用可能依赖手头的数据。决策树归纳算法已经成功应用于多个领域的分类,如医学、制造和生产、金融分析、天文学和分子生物学等。决策树归纳是需要商业规则归纳系统的基础。
决策树归纳
决策树归纳是一个一般的算法框架,根据选择属性准则的不同有三种不同的算法(应该不止这三种):ID3、C4.5、CART。其中C4.5是ID3的提出者对ID3的一种改进,ID3(20世纪70年代后期到20世纪80年代初期)和CART(1984年)大约同时独立的发明,这两个基础算法引发了决策树归纳的风潮。
ID3、C4.5、CART都采用贪心(即非回溯的)方法,决策树以自顶向下递归的分治方式构造。随着树的构建,训练集递归地划分成较小的子集。
基本决策树归纳算法伪代码如下图所示,
伪代码写的还是比较清楚的,详细的步骤说明就不罗列出来了,想了解更多参看《数据挖掘概念与技术(第3版)》214页-216页。
ID3、C4.5、CART
这三种不同的决策树构造方法我们都会进行Java实现,详情见后边的文章。
ID3:http://blog.csdn.net/zhyoulun/article/details/42268413
C4.5:
CART:
参考:《数据挖掘概念与技术(第3版)》
转载请注明出处:http://blog.csdn.net/zhyoulun/article/details/41978381
构建决策树的目的是对已有的数据进行分类,得到一个树状的分类规则,然后就可以拿这个规则对未知的数据进行分类预测。
决策树归纳是从有类标号的训练元祖中学习决策树。
决策树是一种类似于流程图的树结构,其中每个内部节点(非树叶结点)表示一个属性上的测试,每个分支代表该测试上的一个输出,而每个树叶结点(或终端结点)存放一个类标号。树的最顶层结点是根结点。一个典型的决策树如下图所示,
该决策树是通过下表所示的训练元组和它们对应的类标号得到的,
为什么决策树如此流行
决策树分类器的构造不需要任何领域知识或参数设置,因此适合于探测式知识发现。决策树可以处理高维数据。获取的知识用树的形式表示是直观的,并且容易被人理解。决策树归纳的学习和分类步骤是简单和快速的。一般而言,决策树分类器具有很好的准确率。然而,成功的使用可能依赖手头的数据。决策树归纳算法已经成功应用于多个领域的分类,如医学、制造和生产、金融分析、天文学和分子生物学等。决策树归纳是需要商业规则归纳系统的基础。
决策树归纳
决策树归纳是一个一般的算法框架,根据选择属性准则的不同有三种不同的算法(应该不止这三种):ID3、C4.5、CART。其中C4.5是ID3的提出者对ID3的一种改进,ID3(20世纪70年代后期到20世纪80年代初期)和CART(1984年)大约同时独立的发明,这两个基础算法引发了决策树归纳的风潮。
ID3、C4.5、CART都采用贪心(即非回溯的)方法,决策树以自顶向下递归的分治方式构造。随着树的构建,训练集递归地划分成较小的子集。
基本决策树归纳算法伪代码如下图所示,
伪代码写的还是比较清楚的,详细的步骤说明就不罗列出来了,想了解更多参看《数据挖掘概念与技术(第3版)》214页-216页。
ID3、C4.5、CART
这三种不同的决策树构造方法我们都会进行Java实现,详情见后边的文章。
ID3:http://blog.csdn.net/zhyoulun/article/details/42268413
C4.5:
CART:
参考:《数据挖掘概念与技术(第3版)》
转载请注明出处:http://blog.csdn.net/zhyoulun/article/details/41978381
相关文章推荐
- 决策树归纳一般框架(ID3,C4.5,CART)
- 决策树(三)--完整总结(ID3,C4.5,CART,剪枝,替代)
- 决策树(ID3、C4.5、CART)
- 决策树CART与ID3,C4.5联系与区别
- 机器学习算法与Python实践(11) - 决策树 ID3、C4.5、CART
- 2、决策树ID3、C4.5、CART
- 决策树(ID3、C4.5、CART、随机森林)
- python之实战----决策树(ID3,C4.5,CART)战sin(x)+随机噪声
- 决策树(ID3、C4.5、CART、随机森林)
- 决策树(ID3、C4.5、CART、随机森林、GBDT)
- python机器学习案例系列教程——决策树(ID3、C4.5、CART)
- ID3、C4.5、CART三种决策树的区别
- 决策树学习(下)——ID3、C4.5、CART深度剖析及源码实现
- 决策树ID3,C4.5,CART,GBDT,RF
- 2、决策树ID3、C4.5、CART
- 归纳决策树ID3(Java实现)
- 决策树之ID3、C4.5、C5.0
- 决策树归纳(ID3属性选择度量)Java实现
- 《统计学习方法》读书笔记-----决策树:ID3,C4.5生成算法和剪枝
- ID3和C4.5、CART