hadoop-3.0.0完整版HA部署
一、环境准备:
Linux7.2
hadoop-3.0.0.tar.gz
JDK1.8
二、下载源
hadoop3.0.0下载地址:https://archive.apache.org/dist/hadoop/common/
zookeeper-3.4.5下载地址:https://archive.apache.org/dist/zookeeper/
jdk下载地址:https://www.oracle.com/technetwork/java/javase/downloads/index.html
三、JDK安装(所有节点)
3.1 (创建jdk存放目录)
mkdir -p /usr/java
3.2 解压
tar -zxvf hadoop-3.0.0.tar.gz -C /opt
三、安装zookeeper
3.1 解压
tar -zxvf zookeeper-3.4.5.tar.gz -C /opt
cd /opt
mv zookeeper-3.4.5/ zookeeper
3.2 配置zoo.cfg
mkdir -p /opt/zookeeper/data
mkdir -p /opt/zookeeper/logs
cd /opt/zookeeper/conf/
mv zoo_sample.cfg zoo.cfg
vi zoo.cfg
//设置数据及日志存放位置
dataDir=/opt/zookeeper/data
dataLogDir=/opt/zookeeper/logs
//省略其他内容。在zoo.cfg最末尾添加ZK集群信息
server.1=node1:2888:3888
server.2=node2:2888:3888
server.3=node3:2888:3888
echo ‘1’ > /opt/zookeeper/data/myid
3.3 zookeeper分发
scp -r zookeeper/ node02:$PWD
echo ‘2’ > /opt/zookeeper/data/myid
scp -r zookeeper/ node03:$PWD
echo ‘3’ > /opt/zookeeper/data/myid
3.4 验证
cd /opt/zookeeper
./bin/zkServer.sh start
四、hadoop安装
4.1 解压hadoop安装包
tar -zxvf hadoop-3.0.0.tar.gz -C /opt/
cd /opt
mv hadoop-3.0.0/ hadoop
4.2 配置hadoop环境变量(所有节点)
source /etc/profile
hadoop
export HADOOP_HOME=/opt/hadoop
export PATH=PATH:PATH:PATH:HADOOP_HOME/sbin:$HADOOP_HOME/bin
4.3 配置hadoop-env.sh、yarn-env.sh
进入/opt/hadoop目录下面,用vi编辑器打开etc/hadoop/hadoop-env.sh,在hadoop-env.sh末尾添加如下内容:
cd /opt/hadoop/etc/hadoop/
vi hadoop-env.sh
set to the root of my java installation
export JAVA_HOME=/usr/java/jdk1.8.0_162
cd /opt/hadoop-3.0.0/etc/hadoop/
vi yarn-env.sh
some Java parameters
export JAVA_HOME=/usr/java/jdk1.8.0_162
4.4 配置core-site.xml
进入/opt/hadoop目录下面,用vi编辑器打开etc/hadoop/core-site.xml,在core-site.xml的标签对之间添加如下内容:
4.5 配置hdfs-site.xml
进入/opt/hadoop目录下面,用vi编辑器打开etc/hadoop/hdfs-site.xml,在hdfs-site.xml的标签对之间添加如下内容:
mkdir -p /opt/hadoop-3.0.0/datas/journal
mkdir -p /opt/hadoop-3.0.0/datas/namenode
mkdir -p /opt/hadoop-3.0.0/datas/datanode
4.6 mapred-site.xml
这个配置文件本来是不存在的,但是有一个名为mapred-site.xml.template的模板文件,执行mv mapred-site.xml.template mapred-site.xml复制重命名一份就行了
4.7 yarn-site.xml
4.8 安装包分发
cd /opt
scp -r hadoop-3.0.0/ node02:$PWD
scp -r hadoop-3.0.0/ node03:$PWD
五、启动hadoop
5.1 启动journalnode
cd /opt/hadoop/sbin
./hadoop-daemons.sh start journalnode
5.2 格式化namenode
node01和node02计划启动namenode,node01作为主,在node01上格式化:
cd /opt/hadoop/bin/
./hdfs namenode -format
5.3 格式化zk
在node1上执行命令
./hdfs zkfc -formatZK
执行完成后,会在zookeeper 上创建一个目录,查看是否创建成功:
进入cd /opt/zookeeper/bin/目录,执行
./zkCli.sh
在ZK客户端的shell命令行查看:
ls /
[zk: localhost:2181(CONNECTED) 1] ls /
[zookeeper, hadoop-ha]
出现hadoop-ha即表示成功。
5.4 启动主namenode
node01执行.
./hadoop-daemon.sh start namenode
备用NN 同步主NN信息
node02是从node01的namenode同步数据。
在node02上执行
./hdfs namenode -bootstrapStandby
5.5 启动hadoop集群
由于上面我们启动了namenode,这里先将其关闭:在node01上执行
./stop-dfs.sh
在主节点NameNode(node01)启动集群
./start-dfs.sh
该命令会在主和备NN上启动ZKFC守护进程
此时node2机器上也有DFSZKFailoverController服务
5.6 查看各节点进程jps
namenode1和namenode2如下图:
zk辅助节点进程如下图:
datanode节点进程如下图:
5.7 web页面查看
node01:50070
node02:50070
- ambari部署hadoop HA
- hbase-1.1.3 基于 hadoop-2.6.2 ha 分布式部署
- CentOS6.5环境部署Hadoop2.8.1集群(HA)
- hadoop HA集群安装部署
- Hadoop2.4.1尝鲜部署+完整版配置文件
- Hadoop-HDFS学习理解到安装操作,以及HA高可用部署。
- CDH Hadoop HA+Zookeeper部署问题
- Hadoop HA环境部署
- 部署hadoop2.7.2 集群 基于zookeeper配置HDFS HA+Federation
- Win10 下 hadoop3.0.0 单机部署
- kerberos+ladp+hadoop-ha 安全认证部署配置
- hadoop HA架构安装部署(QJM HA)
- Centos7.4部署hadoop(HA)高可用集群(阿里云)
- hadoop2.7.3 ha 环境部署——QJM
- hadoop 集群安装(二) HA部署
- 【4】搭建HA高可用hadoop-2.3(部署配置HBase)
- Hadoop HA部署
- 部署hadoop-2.6.0-cdh5.7.0 HA
- Hadoop2.0 HA安装完整版——Hadoop2.7.3
- hadoop-2.6.0+zookeeper-3.4.6+hbase-1.0.0+hive-1.1.0完全分布式集群HA部署