分层聚类算法
2017-11-01 10:08
211 查看
分层聚类算法
转载▼
看到很多地方都讲到分层聚类法,这到底是什么东东,今天来研究一下。
分层聚类法是聚类算法的一种,聚类算法是数据挖掘的核心技术,把数据库中的对象分类是数据挖掘的基本操作,其准则是使属于同一类的个体间距离尽可能小,而不同类个体间距离尽可能大。
聚类算法一般分为分割和分层两种。
分割聚类算法通过优化评价函数把数据集分割为K个部分,它需要K作为输人参数。
典型的分割聚类算法有K-means算法, K-medoids算法、CLARANS算法。
分层聚类由不同层次的分割聚类组成,层次之间的分割具有嵌套的关系。它不需要输入参数,这是它优于分割聚类算法的一个明显的优点,其缺点是终止条件必须具体指定。
典型的分层聚类算法有BIRCH算法、DBSCAN算法和CURE算法等。
各聚类算法的比较结果
算法 算法效率 适合的数据类型 发现的聚类类型 对脏数据或异常数据的敏感性 对数据输入顺序的敏感性
BIRCH 高 数值 凸形或球形 不敏感 不太敏感
DBSCAN 一般 数值 任意形状 敏感 敏感
CURE 较高 数值 任意形状 不敏感 不太敏感
K-poto
相关文章推荐
- 聚类算法
- K-means聚类算法
- AP聚类算法
- 安卓color属性大全
- 关于DBSCAN算法的通俗理解
- Java实现简单的kmeans聚类
- [ML]聚类之学习向量量化LVQ
- 数据挖掘中,分类与聚类的区别
- 聚类系列-KMEANS
- Clara算法的总结
- 一个确定初始聚类中心的更好方法
- Thinking in SQL系列之五:数据挖掘K均值聚类算法与城市分级
- UCI机器学习库和一些相关算法 | 丕子
- Kmeans聚类是matlab提示“out of memory” 的解决方法
- Kmeans 聚类算法
- 基于BinaryVector优化的KModes算法
- 【opencv】在hsv颜色空间识别区域颜色
- R聚类算法-DBSCAN算法
- 【机器学习】K-Means算法