VirtualBox5.0.18+CentOS7.2+Hadoop2.7.2配置与开发(2)用YARN完成WordCount作业
2016-05-03 00:14
495 查看
运行WordCount作业
步骤:进入hadoop目录,删除input目录和output目录(如果有);
启动hdfs系统,ResourceManager和NodeManager。
$cd /usr/hadoop-2.7.2
$sbin/start-dfs.sh
$sbin/start-yarn.sh
在/usr/hadoop-2.7.2中新建目录userData,userData内存放两个文本文件file1.txt和file2.txt。
$cat userData/file1.txt
Hello world.
Bye world.
$ cat userData/file2.txt
Hello Hadoop.
Bye Hadoop.
重建hdfs内的input目录(如果有)。
查看hdfs的目录及全部子目录和文件:
$ bin/hadoop fs -ls -R .
如果input目录为空,则可用rmdir删除它:
$ bin/hadoop fs -rmdir ./input
如果output目录不为空,则用rm的递归选项删除它:
$ bin/hadoop fs -rm -R ./output
在hdfs内新建input目录。
$ bin/hadoop fs -mkdir ./input
将userData内的file1.txt和file2.txt两个文件上传到HDFS中的input目录
$ bin/hadoop fs -putuserData/file1.txt ./input
$ bin/hadoop fs -put userData/file2.txt ./input
$ bin/hadoop fs -ls -R .
drwxr-xr-x - hadoopsupergroup 0 2016-05-02 12:07input
-rw-r--r-- 1 hadoopsupergroup 24 2016-05-02 12:06 input/file1.txt
-rw-r--r-- 1 hadoopsupergroup 27 2016-05-02 12:07input/file2.txt
执行hadoop自带的WordCount程序,统计单词数
$cd /usr/hadoop-2.7.2/share/hadoop/mapreduce
$/usr/hadoop-2.7.2/bin/hadoop jar hadoop-mapreduce-examples-2.7.2.jarwordcount ./input ./output
输出信息:略
$ cd /usr/hadoop-2.7.2
$ bin/hadoop fs -ls -R .
drwxr-xr-x - hadoopsupergroup 0 2016-05-02 12:07input
-rw-r--r-- 1 hadoopsupergroup 24 2016-05-02 12:06input/file1.txt
-rw-r--r-- 1 hadoopsupergroup 27 2016-05-02 12:07 input/file2.txt
drwxr-xr-x - hadoopsupergroup 0 2016-05-02 12:11output
-rw-r--r-- 1 hadoopsupergroup 0 2016-05-02 12:11output/_SUCCESS
-rw-r--r-- 1 hadoopsupergroup 33 2016-05-02 12:11 output/part-r-00000
查看运行结果:
$ bin/hadoop fs -cat ./output/part-r-00000
Bye 2
Hadoop. 2
Hello 2
world. 2
可见单词统计正确!
相关文章推荐
- Linux socket 初步
- Linux Kernel 4.0 RC5 发布!
- linux lsof详解
- linux 文件权限
- Linux 执行数学运算
- 10 篇对初学者和专家都有用的 Linux 命令教程
- Linux 与 Windows 对UNICODE 的处理方式
- Ubuntu12.04下QQ完美走起啊!走起啊!有木有啊!
- 解決Linux下Android开发真机调试设备不被识别问题
- 详解HDFS Short Circuit Local Reads
- 运维入门
- 运维提升
- Linux 自检和 SystemTap
- Centos6 编译安装Python
- Ubuntu Linux使用体验
- c语言实现hashmap(转载)
- Linux 信号signal处理机制