您的位置:首页 > 其它

分层聚类算法

2017-11-01 10:08 211 查看


分层聚类算法

 


转载▼

看到很多地方都讲到分层聚类法,这到底是什么东东,今天来研究一下。

分层聚类法是聚类算法的一种,聚类算法是数据挖掘的核心技术,把数据库中的对象分类是数据挖掘的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大。

聚类算法一般分为分割和分层两种。

分割聚类算法通过优化评价函数把数据集分割为K个部分,它需要K作为输人参数。

典型的分割聚类算法有K-means算法, K-medoids算法、CLARANS算法。

分层聚类由不同层次的分割聚类组成,层次之间的分割具有嵌套的关系。它不需要输入参数,这是它优于分割聚类算法的一个明显的优点,其缺点是终止条件必须具体指定。

典型的分层聚类算法有BIRCH算法、DBSCAN算法和CURE算法等。

各聚类算法的比较结果

算法        算法效率   适合的数据类型   发现的聚类类型   对脏数据或异常数据的敏感性   对数据输入顺序的敏感性

BIRCH         高            数值              凸形或球形                  不敏感                          不太敏感

DBSCAN     一般          数值                任意形状                    敏感                               敏感

CURE         较高          数值                任意形状                   不敏感                          不太敏感

K-poto   
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息