您的位置:首页 > 其它

Mapreduce

2019-05-26 19:47 309 查看

实验目的:
 搭建MapReduce编程模型
 配置Eclipse和Maven
 Hadoop集群与启动顺序
 MapReduce的WordCount应用
 书上代码练习
 学习编写一个MapReduce程序

实验要求:
 学会使用Maven创建一个工程项目
 配置好运行环境与运行条件
 结合上课课件自己输WordCount程序代码
 运行并得出结果
 在Hadoop集群中提取运行
 还原课本案例
 完成排序与二次排序的操作

实验环境:
 一台独立PC机或虚拟机
 已安装JDK
 已完成Hadoop平台的搭建
 已完成Eclipse安装成功
 已完成Maven

一、搭建mapreduce编程模型
1、新建mapreduce工程项目

2、配置pom.xml依赖文件

3、导入hadoop配置文件

4、启动Hadoop集群
5、查看节点状态

6、新建WordCountApp.java



7、新建SortApp.java

8、新建IntPair.java

9、新建SecondrySort.java

10、使用mvn clean package -DskipTests打包成hadoop-1.0-SNAPSHOT.jar

11、查看打包是否成功

12、将jar包上传/home/admin/hadoop-2.7.3/share/hadoop/mapreduce/下

二、MapReduce词频统计编程实例
1、将测试数据上传到HDFS目录中。

2、提交MapReduce作业到集群运行

3、查看作业输出结果。


三、使用MapReduce实现排序
1、将测试测试数据上传到HDFS目录中。
Hadoop fs -mkdir /sort
Hadoop fs sort.txt /sort



2、提交MapReduce作业到集群运行。

3、查看作业输出结果。

一、四、使用MapReduce实现二次排序
1、提交作业到集群运行。
将测试数据上传到HDFS目录中。


2、提交MapReduce作业到集群运行。

3、查看作业输出结果。

4、浏览器查看

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: