您的位置：首页 > 运维架构

hadoop2.6.0分布式集群搭建(手动和自动HA)

2015-01-31 21:22 543 查看

hadoop1和hadoop2的对比

hadoop1.0中hdfs和mapreduce同属于hadoop集群，而hadoop2.0则把mapreduce分离出来，和其他所有计算模型共

同放到yarn平台上运行，如果想在hadoop2.0的yarn平台上运行任何计算模型，需要实现yarn平台的接口。

hadoop2.0中的federation和HA

federation主要解决的是单一命名空间问题，在hadoop2.0的federation中，可以存在多个集群，每个集群对应一个

nameservice，每个nameservice下管理者一个HA集群，每个HA下目前最多包含有两个namenode主节点的hadoop集

群。一个nameservice下只能有一个namenode处于active状态，另一个处于standBy状态，并可以进行切换(自动和手

动)。federation中的所有datanode均可以为所有的nameservice共用。

下面是集群搭建过程，

-----------------------------

1.整个集群有六个节点，分别是hadoop1-6，搭建手工切换的HA

-----------------------------

namenode：hadoop1和hadoop2

datanode：hadoop3、hadoop4、hadoop5、hadoop6

journalnode：hadoop1、hadoop2、hadoop3

resourcemanager：hadoop1

nodemanager：hadoop3、hadoop4、hadoop5、hadoop6

1.1 配置文件(hadoop-env.sh、core-site.xml、hdfs-site.xml、yarn-site.xml、mapred-site.xml、slaves)

1.1.1 hadoop-env.sh

export JAVA_HOME=/usr/local/jdk

1.1.2 core-site.xml



<property>

<name>fs.defaultFS</name>

<value>hdfs://cluster1</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/usr/local/hadoop/tmp</value>

</property>

1.1.3 hdfs-site.xml

<property>

<name>dfs.replication</name>

<value>3</value>

</property>



<property>

<name>dfs.nameservices</name>

<value>cluster1</value>

</property>



<property>

<name>dfs.ha.namenodes.cluster1</name>

<value>hadoop1,hadoop2</value>

</property>



<property>

<name>dfs.namenode.rpc-address.cluster1.hadoop1</name>

<value>hadoop1:9000</value>

</property>



<property>

<name>dfs.namenode.http-address.cluster1.hadoop1</name>

<value>hadoop1:50070</value>

</property>



<property>

<name>dfs.namenode.rpc-address.cluster1.hadoop2</name>

<value>hadoop2:9000</value>

</property>



<property>

<name>dfs.namenode.http-address.cluster1.hadoop2</name>

<value>hadoop2:50070</value>

</property>



<property>

<name>dfs.ha.automatic-failover.enabled.cluster1</name>

<value>false</value>

</property>



<property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hadoop1:8485;hadoop2:8485;hadoop3:8485/cluster1</value>

</property>



<property>

<name>dfs.journalnode.edits.dir</name>

<value>/usr/local/hadoop/tmp/journal</value>

</property>



<property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>



<property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/root/.ssh/id_rsa</value>

</property>



<property>

<name>dfs.client.failover.proxy.provider.cluster1</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

1.1.4 yarn-site.xml



<property>

<name>yarn.resourcemanager.hostname</name>

<value>hadoop1</value>

</property>



<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

1.1.5 mapred-site.xml



<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>



1.1.6 slaves

hadoop3

hadoop4

hadoop5

hadoop6

1.1.7 把hadoop1上的hadoop文件夹复制到hadoop2、hadoop3、hadoop4、hadoop5、hadoop6节点

1.2 启动journalnode集群

在hadoop1、hadoop2、hadoop3上分别执行hadoop/sbin/hadoop-daemon.sh start journalnode

1.3 格式化namenode、启动namenode

在hadoop1上执行hadoop/bin/hdfs namenode -format

在hadoop1上分别执行hadoop/sbin/hadoop-daemon.sh start namenode

页面http://hadoop1:50070查看集群信息

在hadoop2上执行hadoop/bin/hdfs namenode -bootstrapStandby

在hadoop2上分别执行hadoop/sbin/hadoop-daemon.sh start namenode

下面这行命令是HA中的主节点切换，将namenode主节点active状态切换到hadoop1上

在hadoop1上执行hadoop/bin/hdfs haadmin -failover --forceactive hadoop2
hadoop1

页面http://hadoop1:50070查看集群信息,namenode切换为Active状态

1.4 启动datanode

在hadoop1上分别执行hadoop/sbin/hadoop-daemons.sh start datanode

1.5 启动resourcemanager和nodemanager

在hadoop1上执行 hadoop/sbin/start-yarn.sh start resourcemanager

页面http://hadoop1:8088查看资源信息

1.6 如果搭建HA自动切换的集群，需要再搭建zookeeper集群。

core-site.xml文件中添加

<property>

<name>ha.zookeeper.quorum</name>

<value>hadoop1:2181,hadoop2:2181,hadoop3:2181</value>

</property>

hdfs-site.xml文件中修改配置为true

<property>

<name>dfs.ha.automatic-failover.enabled.cluster1</name>

<value>true</value>

</property>

启动hadoop集群前也需要格式化zookeeper集群

在hadoop1上执行 hadoop/bin/hdfs zkfc -formatZK

在hadoop集群启动后，启动zkfc，实现HA

在hadoop1、hadoop2上启动zkfc，执行命令hadoop/sbin/hadoop-daemon.sh start zkfc

总结：

自动切换比手工切换多出来的

(1)配置上core-site.xml增加了配置项ha.zookeeper.quorum；hdfs-site.xml中把dfs.ha.automatic-

failover.enabled.cluster1改为true

(2)操作上格式化zk，执行命令bin/hdfs zkfc -formatZK；启动zkfc，执行命令sbin/hadoop-daemon.sh start zkfc

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航

添加评论
分享网址
分享文章
返回顶部