Mahout---K-meas算法示例
2017-07-05 18:16
197 查看
Step 1:准备样本集itemsimilarity.txt
http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data
Step 2:
在node11节点上执行命令创建样本集
Step 3:
分别在三个节点执行命令,启动zookeeper
Step 4:
在node11节点上启动命令,启动HDFS和Yarn
Step 5:
打开浏览器,输入URL进行查看HDFS
192.168.80.11:50070
192.168.80.12:50070
打开浏览器,输入URL进行查看Yarn
192.168.80.11:8088
192.168.80.12:8088
Step 6:
在node11节点上执行命令,建立样本集路径,并将样本集上传到HDFS中
Step 7:
在node11节点上执行命令,启动Mahout,进行聚类
Step 8:
查看结果,样本集被聚成了6类
http://archive.ics.uci.edu/ml/databases/synthetic_control/synthetic_control.data
Step 2:
在node11节点上执行命令创建样本集
vi /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/k-means.txt
Step 3:
分别在三个节点执行命令,启动zookeeper
zkServer.sh start zkServer.sh status
Step 4:
在node11节点上启动命令,启动HDFS和Yarn
start-all.sh
yarn-daemon.sh start resourcemanager
Step 5:
打开浏览器,输入URL进行查看HDFS
192.168.80.11:50070
192.168.80.12:50070
打开浏览器,输入URL进行查看Yarn
192.168.80.11:8088
192.168.80.12:8088
Step 6:
在node11节点上执行命令,建立样本集路径,并将样本集上传到HDFS中
hadoop fs -mkdir /user/root/testdata hadoop fs -put /opt/apps/mahout/apache-mahout-distribution-0.10.2/test/k-means.txt /user/root/testdata hadoop fs -ls /user/root/testdata
Step 7:
在node11节点上执行命令,启动Mahout,进行聚类
hadoop jar /opt/apps/mahout/apache-mahout-distribution-0.10.2/mahout-examples-0.10.2-job.jar org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
Step 8:
查看结果,样本集被聚成了6类
相关文章推荐
- Mahout-DistanceMeasure (相似度计算)
- org.apache.mahout.classifier.df.data.DescriptorException: Bad Token
- mahout 常见机器学习算法及分类
- Mahout安装与配置
- eclipse配置mahout
- 基于Mahout的电影推荐系统
- 深入理解mahout基于hadoop的协同过滤流程
- Mahout中相似度计算方法介绍
- hadoop运行mahout问题解决方法
- Mahout推荐引擎测评及源码分析
- Hadoop Mahout数据挖掘实战视频教程
- mahout ArtifactTransferException: Failure to transfer
- Mahout快速入门教程
- Mahout实现k-means算法
- Mahout in action 中文版-2.推荐器的介绍-2.1~2.2
- mahout之canopy算法简单理解
- Mahout对于GroupLens数据定制的推荐引擎
- apache mahout 算法集
- hadoop2.5.2 mahout0.10.1 测试文本分类器
- FuzzyKmeans的Mahout实现