您的位置:首页 > 其它

hbase集群安装

2017-05-21 13:58 106 查看
1.基本信息

版本1.2.4
安装机器三台机器
账号hadoop
源路径/opt/software/hbase-1.2.4-bin.tar.gz
目标路径/opt/hbase -> /opt/hbase-1.2.4
依赖关系zookeeper  hadoop
2.安装过程
1).使用hadoop账号解压到/opt/hadoop目录下并设置软连接:

[root@bgs-5p173-wangwenting opt]# su hadoop
[hadoop@bgs-5p173-wangwenting opt]$ cd /opt/software
[hadoop@bgs-5p173-wangwenting software]$ tar -zxvf hbase-${version}-bin.tar.gz -C /opt
[hadoop@bgs-5p173-wangwenting software]$ cd /opt
[hadoop@bgs-5p173-wangwenting opt]$ ln -s  hbase-${version}/   hbase


2).进入/opt/hbase/conf目录,修改hbase-env.sh文件内容:

[hadoop@bgs-5p173-wangwenting opt]$ cd /opt/hbase/conf
[hadoop@bgs-5p173-wangwenting opt]$ vim hbase-env.sh


export JAVA_HOME=/opt/java
export HBASE_PID_DIR=/opt/hbase/pids
export HADOOP_HOME=/opt/hadoop
export HBASE_HOME=/opt/hbase
export HBASE_MANAGES_ZK=false   #不适用hbase自带的zookeeper,所以这里设置false。


一个分布式运行的HBase依赖一个zookeeper集群。所有的节点和客户端都必须能够访问zookeeper。默认的情况下HBase会管理一个zookeep集群。这个集群会随着HBase的启动而启动。当然,你也可以自己管理一个zookeeper集群,但需要配置HBase。你需要修改
conf/hbase-env.sh
里面的
HBASE_MANAGES_ZK
 来切换。这个值默认是true的,作用是让HBase启动的时候同时也启动zookeeper。

让HBase使用一个已有的不被HBase托管的Zookeep集群,需要设置 
conf/hbase-env.sh
文件中的
HBASE_MANAGES_ZK
 属性为
false,如果我们已经部署过zookeeper集群,那么我们可以不使用hbase自带的zk集群。

3).修改hbase-site.xml文件内容:

[hadoop@bgs-5p173-wangwenting opt]$ vim hbase-site.xml
添加下面内容
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://bgs-5p173-wangwenting:9000/hbase</value>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>bgs-5p173-wangwenting,bgs-5p174-wangwenting,bgs-5p175-wangwenting</value>
</property>
</configuration>


线上hbase配置内容:

[hadoop@namenode2 conf]$ vim hbase-site.xml
<configuration>
<property>
<name>hbase.rootdir</name>
<value>hdfs://abfdhadoop/hbase</value>
<description>这个目录是region server的共享目录,用来持久化HBase。URL需要是'完全正确'的,还要包含文件系统的scheme。例如,要表示hdfs中的'/hbase'目录,需要设置为hdfs://example1:8020/hbase。默认情况下HBase是写到/tmp的。不改这个配置,数据会在重启的时候丢失。</description>
</property>
<property>
<name>hbase.cluster.distributed</name>
<value>true</value>
<description>HBase的运行模式。false是单机模式,true是分布式模式。若为false,HBase和Zookeeper会运行在同一个JVM里面。</description>
</property>
<property>
<name>hbase.fs.tmp.dir</name>
<value>/user/${user.name}/hbase-staging</value>
</property>
<property>
<name>hbase.tmp.dir</name>
<value>/opt/hbase/tmp-dir</value>
<description>本地文件系统的临时文件夹。可以修改到一个更为持久的目录上。(/tmp会在重启时清除)</description>
</property>
<property>
<
db4f
;name>hbase.local.dir</name>
<value>${hbase.tmp.dir}/local/</value>
</property>
<property>
<name>hbase.zookeeper.quorum</name>
<value>kafzook2.abfd,kafzook3.abfd,kafzook4.abfd,kafzook5.abfd,kafzook6.abfd</value>
<description> Zookeeper集群的地址列表,用逗号分割。例如:"host1.mydomain.com,host2.mydomain.com,host3.mydomain.com".默认是localhost,是给伪分布式用的。要修改才能在完全分布式的情况下使用。如果在hbase-env.sh设置了HBASE_MANAGES_ZK,这些ZooKeeper节点就会和HBase一起启动。一般情况下我们会将HBASE_MANAGES_ZK设置为false.</description>
</property>
<property>
<name>hbase.zookeeper.property.clientPort</name>
<value>2181</value>
<description>ZooKeeper的zoo.conf中的配置。 客户端连接的端口</description>
</property>

<property>
<name>hbase.client.scanner.timeout.period</name>
<value>1200000</value>
</property>

<property>
<name>hbase.rpc.timeout</name>
<value>1200000</value>
</property>

<property>
<name>zookeeper.session.timeout</name>
<value>1200000</value>
<description> ZooKeeper 会话超时.HBase把这个值传递改zk集群,向他推荐一个会话的最大超时时间</description>
</property>

<property>
<name>hbase.hregion.max.filesize</name>
<value>53687091200</value>
<description>最大HStoreFile大小。若某个列族的HStoreFile增长达到这个值,这个Hegion会被切割成两个。 默认: 10G,上面我们选择50G</description>
</property>

<property>
<name>hbase.regionserver.handler.count</name>
<value>60</value>
<description>RegionServers受理的RPC Server实例数量。对于Master来说,这个属性是Master受理的handler数量</description>
</property>

<property>
<name>hbase.column.max.version</name>
<value>3</value>
</property>

<property>
<name>hbase.region.replica.replication.enabled</name>
<value>true</value>
</property>

<property>
<name>hbase.regionserver.executor.openregion.threads</name>
<value>100</value>
</property>

<!-- balance -->
<property>
<name>hbase.balancer.period</name>
<value>300000</value>
</property>

<!-- major compaction -->
<property>
<name>hbase.hregion.majorcompaction</name>
<value>0</value>
<description>majorcompaction的执行周期,如果设置成0的话表示关闭自动的compact,关闭自动的compact,写程序定时手工compact</description>
</property>

<property>
<name>hbase.hregion.memstore.block.multiplier</name>
<value>8</value>
<description>如果memstore缓存的内容大小超过flush.size的值的2倍的时候,会进行flush</description>
</property>

<property>
<name>hbase.hstore.flusher.count</name>
<value>16</value>
</property>

<property>
<name>hbase.regionserver.thread.compaction.small</name>
<value>8</value>
</property>

</configuration>


4).修改/opt/hbase/conf/regionservers文件内容: 

[hadoop@bgs-5p173-wangwenting opt]$ vim /opt/hbase/conf/regionservers
添加以下内容:
bgs-5p174-wangwenting
bgs-5p175-wangwenting


5).通过scp复制到其它两台机器上:

[hadoop@bgs-5p173-wangwenting opt]$ scp -r /opt/hbase-${version} hadoop@bgs-5p174-wangwenting:/opt
[hadoop@bgs-5p174-wangwenting opt]$ ln -s hbase-${version}/  hbase
[hadoop@bgs-5p173-wangwenting opt]$ scp -r /opt/hbase-${version} hadoop@bgs-5p175-wangwenting:/opt
[hadoop@bgs-5p175-wangwenting opt]$ ln -s hbase-${version}/  hbase


6).在bgs-5p173-wangwenting上启动hbase集群:

[hadoop@bgs-5p173-wangwenting opt]$ /opt/hbase/bin/start-hbase.sh


7).查看集群是否启动,运行jps

[hadoop@bgs-5p173-wangwenting opt]$ jps
若bgs-5p173-wangwenting如下所示:
22898 ResourceManager
20739 Jps
24383 JobHistoryServer
20286 HMaster
22722 SecondaryNameNode
22488 NameNode
[hadoop@bgs-5p174-wangwenting opt]$ jps
2141 NodeManager
3257 HRegionServer
25283 Jps
1841 DataNode
[hadoop@bgs-5p175-wangwenting opt]$ jps
2141 NodeManager
3257 HRegionServer
25283 Jps
1841 DataNode


8).使用/opt/hbase/bin/hbase shell命令测试安装结果:

[hadoop@bgs-5p173-wangwenting opt]$ /opt/hbase/bin/hbase shell


a.创建表test: 

hbase(main):002:0> create "test", "cf"
0 row(s) in 2.5840 seconds
=> Hbase::Table - test


b.列出全部表:

hbase(main):003:0> list
TABLE
test
1 row(s) in 0.0310 seconds
=> ["test"]


启动Hadoop和HBase之后,执行jps命令,已经看到有HMaster的进程,但是进入到HBase的shell,执行一个命令,会出现下面的错误:



解决方法:

进入到logs目录查看master的日志:发现一直显示下面的内容:

[hadoop@s1 logs]$ vim hbase-hadoop-master-是.log


2017-03-13 17:13:17,374 INFO org.apache.hadoop.hbase.util.FSUtils: Waiting for dfs to exit safe mode...
2017-03-13 17:13:27,377 INFO org.apache.hadoop.hbase.util.FSUtils: Waiting for dfs to exit safe mode...
2017-03-13 17:13:37,386 INFO org.apache.hadoop.hbase.util.FSUtils: Waiting for dfs to exit safe mode...
2017-03-13 17:13:47,393 INFO org.apache.hadoop.hbase.util.FSUtils: Waiting for dfs to exit safe mode...
2017-03-13 17:13:57,395 INFO org.apache.hadoop.hbase.util.FSUtils: Waiting for dfs to exit safe mode...
2017-03-13 17:14:07,409 INFO org.apache.hadoop.hbase.util.FSUtils: Waiting for dfs to exit safe mode...


原来是Hadoop在刚启动的时候,还处在安全模式造成的,手动退出Hadoop的安全模式.然后重新启动hbase服务。



重启后输入list,便不再报错了。



 

c.插入数据到test表:

hbase(main):001:0> put "test","row","cf:a","value"
0 row(s) in 0.4150 seconds


d.查看test表信息:

hbase(main):002:0> scan 'test'
ROW           COLUMN+CELL
row          column=cf:a, timestamp=1447246157917, value=value
1 row(s) in 0.0270 seconds


若hbase shell测试成功,则进入浏览器访问以下网址:http://172.24.5.173:16010/



 

若正常显示,则hbase集群安装成功!  用ip保险一点,用域名首先要在自己的电脑host文件中配置。

9).启动thriftserver2服务

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: