您的位置:首页 > 其它

Mahout---K-meas算法示例

2017-07-05 18:16 197 查看
Step 1:准备样本集itemsimilarity.txt

http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data

Step 2:

在node11节点上执行命令创建样本集

vi /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/k-means.txt




Step 3:

分别在三个节点执行命令,启动zookeeper

zkServer.sh start
zkServer.sh status








Step 4:

在node11节点上启动命令,启动HDFS和Yarn

start-all.sh




yarn-daemon.sh start resourcemanager




Step 5:

打开浏览器,输入URL进行查看HDFS

192.168.80.11:50070

192.168.80.12:50070





打开浏览器,输入URL进行查看Yarn

192.168.80.11:8088

192.168.80.12:8088





Step 6:

在node11节点上执行命令,建立样本集路径,并将样本集上传到HDFS中

hadoop fs -mkdir /user/root/testdata
hadoop fs -put /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/k-means.txt /user/root/testdata
hadoop fs -ls /user/root/testdata




Step 7:

在node11节点上执行命令,启动Mahout,进行聚类

hadoop jar /opt/apps/mahout/apache-mahout-distribution-0.10.2/mahout-examples-0.10.2-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job


Step 8:

查看结果,样本集被聚成了6类

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息