Density Peak
2017-04-24 15:34
113 查看
参考文献:2014年发表在Nature上的文章Clustering by fast search and find of density peaks
核心思想:密度比邻居节点高、与比其密度大的点的距离相对大的点是聚类中心。
1. 两个定义:
1.1.局部密度ρ:
ρi=∑jχ(dij−dc)
其中,χ(x)={1,0,x<0otherwise (cutoff kernal)
也可以采用gassion kernal计算:ρi=∑jexp(−(dijdc)2)
1.2.密度比i大且距i最近的点与i的距离δ:
δi=minj:ρj>ρidij
特别的,对于密度最大的点,δi=maxj(dij)
2.聚类中心的选择
ρ和δ相对较大的点为聚类中心,通过ρ-δ散点图观察
3.其他点的分配
其余非聚类中心点,被分配到密度比其大、距离最近的点所属的类(高密度向低密度传播,因此适用于流型)
4.分配的可靠性度量
没有引入noise-signal cutoff.本文为每个聚类定义了border
region(分配到该类但距其他类中点的距离小于dc的点的集合) 对每个聚类,找到其borderregion中点的最大密度ρb
在某个聚类c中,ρi>ρb,则i会分配到聚类c中,否则i被称为halo(可以被理解为噪声)
5.dc的取值
可以去dc,使得平均邻居数占数据集中所有点的1%-2%
dc的取值具有鲁棒性,dc大,ρ大,计算δ和选中心点时只比较相对大小,与具体的数值无关
6.cutoff kernal or gaussion kernal
对与小数据集,ρ和δ 的计算不可避免的受统计误差影响,因此计算ρ时采用gaussion kernal要更好些。
7.实验效果
输入:距离矩阵/相似度矩阵(不一定要是欧式距离),只需要点之间的关系(通过MDS多维尺度变换能直观的展现数据点之间在多种距离上离得多近,还可以产生一个低维的数据点表示,MDS不需要原始数据,只需要衡量点间距离的距离矩阵。)
7.1.Spiral
7.2.Flame
7.3.Aggregation
7.4.Jain
8.思考
Q1.当密度分布不均匀时,聚类效果如何?
效果不好(如Jain数据集),在计算局部密度时并没有考虑局部结构
Q2.重叠群组?
不交叉
核心思想:密度比邻居节点高、与比其密度大的点的距离相对大的点是聚类中心。
1. 两个定义:
1.1.局部密度ρ:
ρi=∑jχ(dij−dc)
其中,χ(x)={1,0,x<0otherwise (cutoff kernal)
也可以采用gassion kernal计算:ρi=∑jexp(−(dijdc)2)
1.2.密度比i大且距i最近的点与i的距离δ:
δi=minj:ρj>ρidij
特别的,对于密度最大的点,δi=maxj(dij)
2.聚类中心的选择
ρ和δ相对较大的点为聚类中心,通过ρ-δ散点图观察
3.其他点的分配
其余非聚类中心点,被分配到密度比其大、距离最近的点所属的类(高密度向低密度传播,因此适用于流型)
4.分配的可靠性度量
没有引入noise-signal cutoff.本文为每个聚类定义了border
region(分配到该类但距其他类中点的距离小于dc的点的集合) 对每个聚类,找到其borderregion中点的最大密度ρb
在某个聚类c中,ρi>ρb,则i会分配到聚类c中,否则i被称为halo(可以被理解为噪声)
5.dc的取值
可以去dc,使得平均邻居数占数据集中所有点的1%-2%
dc的取值具有鲁棒性,dc大,ρ大,计算δ和选中心点时只比较相对大小,与具体的数值无关
6.cutoff kernal or gaussion kernal
对与小数据集,ρ和δ 的计算不可避免的受统计误差影响,因此计算ρ时采用gaussion kernal要更好些。
7.实验效果
输入:距离矩阵/相似度矩阵(不一定要是欧式距离),只需要点之间的关系(通过MDS多维尺度变换能直观的展现数据点之间在多种距离上离得多近,还可以产生一个低维的数据点表示,MDS不需要原始数据,只需要衡量点间距离的距离矩阵。)
7.1.Spiral
7.2.Flame
7.3.Aggregation
7.4.Jain
8.思考
Q1.当密度分布不均匀时,聚类效果如何?
效果不好(如Jain数据集),在计算局部密度时并没有考虑局部结构
Q2.重叠群组?
不交叉
相关文章推荐
- 详解Android应用中屏幕尺寸的获取及dp和px值的转换
- 基于Android中dp和px之间进行转换的实现代码
- 简单谈谈Android中SP与DP的区别
- Android中dip、dp、sp、pt和px的区别详解
- Oracle 基础篇 --- 聚簇因子(clustering_factor)
- LFC1.0.0 版本发布
- Android dpi,dip,dp的概念以及屏幕适配
- Android px、dp、sp之间相互转换
- HP data protector软件学习1--基本角色与基本工作流程
- HP data protector软件学习2--软件组成与界面介绍
- 关于显示的Util
- android中像素单位dp、px、pt、sp的比较
- Android常用单位px, dp, sp
- android中的dp概念以及关系换算
- Android对px和dip进行尺寸转换的方法
- LeetCode 198. House Robber
- LeetCode 121. Best Time to Buy and Sell Stock
- LeetCode 338.Counting Bits
- Spark GraphX之全局聚类系数、局部聚类系数、网络平均聚类系数
- 关于UI切图与开发 px和dp