您的位置:首页 > 运维架构

欢迎使用CSDN-markdown编辑器

2017-11-09 10:32 120 查看

k-means 聚类hadoop 平台

1.1 在参考了

《数据算法-hadoop 、spark 》 289 页;文章 Research on Parallel k-means Algorithm Design Based on Hadoop Platform 基于云计算平台Hadoop的并行k-means聚类算法设计研究;http://blog.csdn.net/kghwettwe/article/details/43917107 代码

大概了解了 k-means 的流程

1.2 在map 主要做的是计算各个数据点与聚类中心的距离并且找出与样本对应的最近中心。 计算新的聚类中心
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  hadoop