Eclipse配置Hadoop环境并运行WordCount样例
2016-07-08 20:37
661 查看
1、下载Hadoop插件并安装
(1)下载hadoop-eclipse-plugin-2.7.2.jar,链接:http://download.csdn.net/detail/tondayong1981/9432425
(2)安装:将hadoop-eclipse-plugin-2.7.2.jar拷贝到/usr/lib/eclipse/plugins目录下
2、配置Hadoop的安装目录
(1)打开Eclipse,Window -> Preferences 出现Hadoop Map/Reduce选项
(2)配置Hadoop installation directory,点击Browser按钮,填入Hadoop的安装目录
3、新建Hadoop Location
(1)打开Map/Reduce视图:Window -> Show View -> Other... -> MapReduce Tools -> Map/Reduce Locatons,底部框中出现Map/Reduce
Locatons
(2)在Map/Reduce Locatons下方,右键选择New Hadoop location...,根据hadoop/etc/hadoop/mapred-site.xml和hadoop/etc/hadoop/core-site.xml配置相应的IP和端口
4、新建Hadoop项目
(1)File -> new - project -> Map/Reduce Project
(2)Next -> 输入Project name:WordCount -> Next -> Finish
5、连接DFS
(1)左侧Project Explorer一栏中出现DFS Locations和WordCount两个选项。
(2)展开DFS Locations,出现连接不上的错误。
这是因为我还没有启动dfs,使用脚本start-dfs.sh运行dfs。
使用jps命令查看是否启动成功。
说明已经成功启动,右键Hadoop重新连接。
连接成功,会显示dfs中的内容,input和output文件是我之前安装hadoop时,测试wordcount程序时创建的。
6、为WordCount工程添加代码
(1)在WordCount项目中新建package名为test,新建类WordCount,出现WordCount.java。
(2)复制hadoop-2.7.2源码中提供的WordCount.java中代码到我们新建的WordCount.java文件中。
WordCount.java在hadoop-2.7.2-src/hadoop-mapreduce-project/hadoop-mapreduce-examples/src/main/java/org/apache/hadoop/examples/目录下;
hadoop-2.7.2源码下载链接:http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2-src.tar.gz
7、运行WordCount项目
先配置运行参数,点击运行按钮 -> Run Configurations -> Aarguments
输入配置参数,即相应input和output目录存放的路径:hdfs://localhost:9000/user/hadoop/input hdfs://localhost:9000/user/hadoop/output 然后Apply -> Run
如果之前存在output目录需要先将其删除,否则会报错,报错如下:
我们将之前使用的output目录删掉
然后再次运行WordCount.java
没有报错,然后刷新DFS下的user
此时又增加了output文件夹,说明程序运行成功。
可以查看part-r-00000中的内容,这是单词的统计结果。
完毕。
(1)下载hadoop-eclipse-plugin-2.7.2.jar,链接:http://download.csdn.net/detail/tondayong1981/9432425
(2)安装:将hadoop-eclipse-plugin-2.7.2.jar拷贝到/usr/lib/eclipse/plugins目录下
2、配置Hadoop的安装目录
(1)打开Eclipse,Window -> Preferences 出现Hadoop Map/Reduce选项
(2)配置Hadoop installation directory,点击Browser按钮,填入Hadoop的安装目录
3、新建Hadoop Location
(1)打开Map/Reduce视图:Window -> Show View -> Other... -> MapReduce Tools -> Map/Reduce Locatons,底部框中出现Map/Reduce
Locatons
(2)在Map/Reduce Locatons下方,右键选择New Hadoop location...,根据hadoop/etc/hadoop/mapred-site.xml和hadoop/etc/hadoop/core-site.xml配置相应的IP和端口
4、新建Hadoop项目
(1)File -> new - project -> Map/Reduce Project
(2)Next -> 输入Project name:WordCount -> Next -> Finish
5、连接DFS
(1)左侧Project Explorer一栏中出现DFS Locations和WordCount两个选项。
(2)展开DFS Locations,出现连接不上的错误。
这是因为我还没有启动dfs,使用脚本start-dfs.sh运行dfs。
使用jps命令查看是否启动成功。
说明已经成功启动,右键Hadoop重新连接。
连接成功,会显示dfs中的内容,input和output文件是我之前安装hadoop时,测试wordcount程序时创建的。
6、为WordCount工程添加代码
(1)在WordCount项目中新建package名为test,新建类WordCount,出现WordCount.java。
(2)复制hadoop-2.7.2源码中提供的WordCount.java中代码到我们新建的WordCount.java文件中。
WordCount.java在hadoop-2.7.2-src/hadoop-mapreduce-project/hadoop-mapreduce-examples/src/main/java/org/apache/hadoop/examples/目录下;
hadoop-2.7.2源码下载链接:http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.7.2/hadoop-2.7.2-src.tar.gz
7、运行WordCount项目
先配置运行参数,点击运行按钮 -> Run Configurations -> Aarguments
输入配置参数,即相应input和output目录存放的路径:hdfs://localhost:9000/user/hadoop/input hdfs://localhost:9000/user/hadoop/output 然后Apply -> Run
如果之前存在output目录需要先将其删除,否则会报错,报错如下:
我们将之前使用的output目录删掉
然后再次运行WordCount.java
没有报错,然后刷新DFS下的user
此时又增加了output文件夹,说明程序运行成功。
可以查看part-r-00000中的内容,这是单词的统计结果。
完毕。
相关文章推荐
- 详解HDFS Short Circuit Local Reads
- Hadoop_2.1.0 MapReduce序列图
- 使用Hadoop搭建现代电信企业架构
- MyEclipse Web Project转Eclipse Dynamic Web Project
- Windows Clang开发环境备忘
- 单机版搭建Hadoop环境图文教程详解
- 傻瓜式用Eclipse连接MySQL数据库
- hadoop常见错误以及处理方法详解
- Eclipse引入jquery报错如何解决
- 让Flex Builder 3.0与Eclipse3.4整合起来
- Eclipse配置Javascript开发环境图文教程
- 使用zend studio for eclipse不能激活代码提示功能的解决办法
- 图解Eclipse j2ee开发环境的搭建过程
- 两种Eclipse部署动态web项目方法
- ext for eclipse插件安装方法
- 解决Fedora14下eclipse进行android开发,ibus提示没有输入窗口的方法详解
- eclipse导入jquery包后报错的解决方法
- Eclipse 格式化代码时不换行与自动换行的实现方法
- Eclipse下jQuery文件报错出现错误提示红叉
- eclipse如何忽略js文件报错(附图)