您的位置：首页 > 其它

Mahout---K-meas算法示例

2017-07-05 18:16 197 查看

Step 1：准备样本集itemsimilarity.txt

http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data

Step 2：

在node11节点上执行命令创建样本集

vi /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/k-means.txt

Step 3：

分别在三个节点执行命令，启动zookeeper

zkServer.sh start
zkServer.sh status

Step 4：

在node11节点上启动命令，启动HDFS和Yarn

start-all.sh

yarn-daemon.sh start resourcemanager

Step 5：

打开浏览器，输入URL进行查看HDFS

192.168.80.11:50070

192.168.80.12:50070

打开浏览器，输入URL进行查看Yarn

192.168.80.11:8088

192.168.80.12:8088

Step 6：

在node11节点上执行命令，建立样本集路径，并将样本集上传到HDFS中

hadoop fs -mkdir /user/root/testdata
hadoop fs -put /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/k-means.txt /user/root/testdata
hadoop fs -ls /user/root/testdata

Step 7：

在node11节点上执行命令，启动Mahout,进行聚类

hadoop jar /opt/apps/mahout/apache-mahout-distribution-0.10.2/mahout-examples-0.10.2-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job

Step 8:

查看结果，样本集被聚成了6类

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： Mahout k-means算法样本集聚类

相关文章推荐

新的分享

章节导航