hadoop完全分布式集群搭建全部流程之二:伪分布式搭建
2017-12-02 14:09
726 查看
一:Hadoop运行模式
1)官方网址(1)官方网站:
http://hadoop.apache.org/
(2)各个版本归档库地址
https://archive.apache.org/dist/hadoop/common/hadoop-2.7.2/
(3)hadoop2.7.2版本详情介绍
http://hadoop.apache.org/docs/r2.7.2/
2)Hadoop运行模式
(1)本地模式(默认模式):
不需要启用单独进程,直接可以运行,测试和开发时使用。
(2)伪分布式模式:
等同于完全分布式,只有一个节点,需要启动集群。。
(3)完全分布式模式:基于伪分布式搭建的
多个节点一起运行
二:基于hadoop本地模式运行
1。基于本地模式运行官方grep案例
在前一篇博客的基础上,系统弄装好了hadoop和java.并且可以运行。这里运行的程序都是 hadoop官方自带的已经写好的mapreduce程序,我们直接调用就行了。官方自带了很多MR程序。只是实际开发中,一般都是定制MR程序进行相关的运算。1)创建在hadoop-2.7.2文件下面创建一个input文件夹
[robot@hadoop101 hadoop-2.7.2]$mkdir input
2)将hadoop的xml配置文件复制到input
[robot@hadoop101 hadoop-2.7.2]$cp etc/hadoop/*.xml
input
3)执行share目录下的mapreduce程序
[robot@hadoop101
hadoop-2.7.2]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a- z.]+'
4)查看输出结果
[robot@hadoop101
hadoop-2.7.2]$ cat output/*
2 本地模式运行官方wordcount案例
1)创建在hadoop-2.7.2文件下面创建一个wcinput文件夹
[robot@hadoop101
hadoop-2.7.2]$mkdir wcinput
2)在wcinput文件下创建一个wc.input文件
[robot@hadoop101
hadoop-2.7.2]$cd wcinput
[robot@hadoop101
wcinput]$touch wc.input
3)编辑wc.input文件
[robot@hadoop101 wcinput]$vim wc.input 在文件中输入如下内容 hadoop yarn hadoop mapreduce robot robot 保存退出::wq |
5)执行程序:
[robot@hadoop101
hadoop-2.7.2]$ hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput wcoutput
6)查看结果:
[robot@hadoop101
hadoop-2.7.2]$cat wcoutput/part-r-00000
robot 2
hadoop 2
mapreduce 1
yarn 1
三:搭建伪分布式hadoop集群并且调试运行
伪分布式运行Hadoop案例
3.1 HDFS上运行MapReduce程序
1)分析:(1)准备1台客户机
(2)安装jdk
(3)配置环境变量
(4)安装hadoop
(5)配置环境变量
(6)配置集群
(7)启动、测试集群增、删、查
(8)在HDFS上执行wordcount案例
2)执行步骤
需要配置hadoop文件如下
(1)配置集群
(a)配置:hadoop-env.sh
Linux系统中获取jdk的安装路径:
[root@ hadoop101 ~]# echo $JAVA_HOME
/opt/module/jdk1.7.0_79
修改JAVA_HOME路径:
export JAVA_HOME=/opt/module/jdk1.7.0_79 |
<!--指定HDFS中NameNode的地址--> <property> <name>fs.defaultFS</name> <value>hdfs://hadoop101:9000</value> </property> <!--指定hadoop运行时产生文件的存储目录--> <property> <name>hadoop.tmp.dir</name> <value>/opt/module/hadoop-2.7.2/data/tmp</value> </property> |
<!--指定HDFS副本的数量,只有一台机器,所以副本数只能设置成1--> <property> <name>dfs.replication</name> <value>1</value> </property> |
(a)格式化namenode(第一次启动时格式化,以后就不要总格式化)
bin/hdfs namenode -format
(b)启动namenode
sbin/hadoop-daemon.sh start namenode
(c)启动datanode
sbin/hadoop-daemon.sh start datanode
(3)查看集群
(a)查看是否启动成功
[root@hadoop101 ~]# jps
13586 NameNode
13668 DataNode
13786 Jps
(b)查看产生的log日志
当前目录:/opt/module/hadoop-2.7.2/logs
[root@hadoop101 logs]# ls
hadoop-root-datanode-hadoop.robot.com.log
hadoop-root-datanode-hadoop.robot.com.out
hadoop-root-namenode-hadoop.robot.com.log
hadoop-root-namenode-hadoop.robot.com.out
SecurityAuth-root.audit
[root@hadoop101 logs]# cat hadoop-root-datanode-hadoop.robot.com.log
(c)web端查看HDFS文件系统
http://192.168.1.101:50070/dfshealth.html#tab-overview
注意:如果不能查看,看如下帖子处理
http://www.cnblogs.com/zlslch/p/6604189.html
(4)操作集群
(a)在hdfs文件系统上创建一个input文件夹
[robot@hadoop101
hadoop-2.7.2]$ bin/hdfs dfs -mkdir -p /user/robot/mapreduce/wordcount/input
(b)将测试文件内容上传到文件系统上
bin/hdfs dfs -put wcinput/wc.input /user/robot/mapreduce/wordcount/input/
(c)查看上传的文件是否正确
bin/hdfs dfs -ls /user/robot/mapreduce/wordcount/input/
bin/hdfs dfs -cat /user/robot/mapreduce/wordcount/input/wc.input
(d)在Hdfs上运行mapreduce程序
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar
wordcount /user/robot/mapreduce/wordcount/input/ /user/robot/mapreduce/wordcount/output
(e)查看输出结果
命令行查看:
bin/hdfs dfs -cat /user/robot/mapreduce/wordcount/output/*
浏览器查看
(f)将测试文件内容下载到本地
hadoop fs -get /user/robot/mapreduce/wordcount/output/part-r-00000
./wcoutput/
(g)删除输出结果
hdfs dfs -rmr /user/robot/mapreduce/wordcount/output
总的来说伪分布只是为了测试使用,熟悉一下hadoop。实际开发测试中还是完全分布式的使用,下面继续完全分布式的搭建。
相关文章推荐
- hadoop完全分布式集群搭建全部流程之一:hadoop和java安装
- hadoop完全分布式集群搭建全部流程之三:完全分布式集群搭建
- hadoop完全分布式集群搭建全部流程之四:ssh和脚本补充
- hadoop初学入门之二:完全分布式集群搭建
- DayDayUP_大数据学习课程[1]_hadoop2.6.0完全分布式集群环境和伪分布式集群搭建
- Hadoop2.7.2 Centos 完全分布式集群环境搭建 (1) - 基础环境准备-2
- Hadoop-2.6.0完全分布式集群搭建和测试(一)
- 虚拟机下CentOS-6.4搭建Hadoop1.1.2完全分布式集群
- Hadoop-1.1.2、HBase-0.94.7完全分布式集群搭建
- 搭建3个节点的hadoop集群(完全分布式部署)--3 zookeeper与hbase安装
- Hadoop 2.2 YARN分布式集群搭建配置流程
- 完全分布模式hadoop集群安装配置之二 添加新节点组成分布式集群
- hadoop完全分布式集群搭建
- ubuntu14-Hadoop2.7.2完全分布式集群搭建操作时遇到的错误
- hadoop完全分布式集群搭建
- Hadoop2.7.3完全分布式集群搭建和测试
- hadoop集群环境搭建----完全分布式
- Hadoop2.7.3+Spark2.1.0完全分布式集群搭建过程
- Hadoop完全分布式集群搭建手记(CentOS6.7+Hadoop2.6手把手胸贴胸详细版)
- hadoop2.x 完全分布式详细集群搭建(图文:4台机器)