您的位置:首页 > 其它

白话机器学习算法(三)基于密度的聚类 DBSCAN

2015-02-13 09:50 253 查看
http://blog.csdn.net/wangxin110000/article/details/22092655

DBSCAN是一种基于密度的聚类算法,能找到被低密度区域分离的高密度区域

我们先聊聊港台电影里有关黑老大的片段,我们先定义三种人:

1) :黑老大:既然能称为黑老大,那周围一定有一帮人,这群人中有的单纯就是马仔,有的人则可能是另一个帮派的黑老大;

2) :马仔:跟在黑老大后面干活的,马仔周围至少有一个黑老大,要不然怎么能称为马仔;

3) :普通人:守法好公民,远离黑社会;

DBSCAN中分为三种点

1):核心点,这就相当于一个“黑老大”,黑老大周围的人要达到一定数目才能称为黑老大,这个数目就是密度;

2):非核心点:马仔,马仔周围人不多,当不成黑老大,但是马仔周围至少有个黑老大;

3):噪音点:好公民咯,周围人不多,朋友都是好公民。

定义完这三种点,现在开始聚类,黑帮要联手,黑黑联合,小弟也跟着加入,(相当于传销了,一个拉一个,都是拉周围的人),最后这些黑帮都成了一个大黑帮,就是一个聚类块;

我们可以看出,只要开始联合,凡是在他们那个圈子里的,谁都别想逃!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: