您的位置:首页 > 运维架构 > 网站架构

编译安装 Heartbeat 搭建高可用集群

2010-10-28 22:11 423 查看
环境
OS:Redhat5.4
VirtualBox:3.2.8
HeartBeat:2.1.4
Node 数量:2
源代码安装 Heartbeat 依赖于 libnet 这个软件包,这个软件包没有收录在系统中,需要手工编译安装
下载地址:http://linux.softpedia.com/get/Programming/Libraries/Libnet-10275.shtml
这是编译安装需要安装的软件包
glib2-devel
python-devel
pam-devel
e2fsprogs-devel
uuid library
bzip2
libxml-devel
guntls-devel

#创建heartbeat用户和组

# 编译安装 Heartbeat
tar xvjf Heartbeat-STABLE-2-1-STABLE-2.1.4.tar.bz2 -C /usr/local/src/
cd /usr/local/src/Heartbeat-STABLE-2-1-STABLE-2.1.4/
./ConfigureMe configure
make && make install
heartbeat1.X与2.X配置文件的区别
/etc/ha.d/authkeys 该文件在两个版本作用是完全相同的,都必须设置,并且保证每个节点(node)内容一样;

/etc/ha.d/ha.cf 这个是主要配置文件,由其决定v1或v2 style格式

/etc/ha.d/haresources 这是v1的资源配置文件

/var/lib/heartbeat/crm/cib.xml 这是v2的资源配置文件,两者根据ha.cf的设定只能选其一

/etc/ha.d/ha.cf 这个文件是heartbeat的主要配置文件
这是没有注释的行,也就是需要配置的
debugfile /var/log/ha-debug

logfile /var/log/ha-log

logfacility local0
设置系统日志的信息范围为 local0
keepalive 2
设置心跳的检测时间,默认单位为秒
deadtime 30
宣布节点死亡的时间,单位为秒
warntime 10
通过这个来调整判断节点的死亡时间
initdead 120
Heartbeat 启动资源的等待时间,单位为秒
udpport 694
设定用于bcast和ucast通信的端口,默认为 UDP 694
ucast eth1 10.10.10.2
心跳网卡和对方的ip地址
auto_failback on
这个设定会使节点具备优先级。当服务运行于备机上时,如果主节点已恢复,会自动取回运行在备机上的服务。
node heartbeat-1.site heartbeat-2.site
节点信息
ping 192.168.1.1
指定ping节点,检测网络状态,通常是网关
respawn hacluster /usr/lib/heartbeat/ipfail

设定 Heartbeat 监控的服务,该服务会随着 Heartbeat 服务启动时启动,停止时则一起停止。当出现意外导致该服务停止时,Heartbeat 将自动重启该服务
respawn hacluster /usr/lib/heartbeat/pingd -m 100 -d 5s

Heartbeat Version1.X.X 中用ipfail ,而2.X.X 中用pingd
apiauth ipfail gid=haclient uid=hacluster

客户端API访问控制。这里指定运行 ipfail 的用户和用户组
apiauth ping gid=haclient uid=hacluster

apiauth pingd gid=haclient uid=hacluster

crm respawn
支持crm管理

群集资源文件
haresource或者cib.xml
haresource格式比较简单,可以直接编辑,但是cib.xml格式比较复杂,最好通过GUI界面或者用工具转换V1文件
这是V1.X的 httpd资源的一个例子,这个ip是资源的ip,假如资源在node1上,那么网卡会虚拟出一个网卡,而IP 就是这个IP
heartbeat-1 IPaddr::192.168.228.235 httpd mysql
heartbeat是资源的主控节点
如果集群需要实现Active-Active(互备)状态,则可以再写一行,但托管的应用不能冲突。
cib.xml 文件的编辑方式
1人工编写XML文件;

2使用admintools工具,其已经包含在heartbeat包中;

3使用GUI图形工具配置,也包含在heartbeat-gui包里面;

4使用python脚本转换1.x style的格式配置文件

authkeys配置文件
该文件是集群中各节点相互认证的配置文件,允许使用crc(明文)、md5、sha1等不同的验证方式,可以使用heartbeat自带的示例来修改
!!!文件的权限必须是600,
auth 2

1 crc

2 sha1 HI!

3 md5 Hello!
每种验证方式耗费的系统资源也是不一样的,性能安全平衡一下吧
最后还要把heartbeat添加为系统服务
chkconfig –add heartbeat
chkconfig --level 2354 heartbeat on
在我启动heartbeat的服务的时候,遇到了这样一个错误

[root@heartbeat-1 ha.d]# /etc/init.d/heartbeat start
logd is already running
Starting High-Availability services:
2010/10/16_01:43:54 INFO:  Resource is stopped
[FAILED]
heartbeat[3208]: 2010/10/16_01:43:54 WARN: heartbeat: udp port 1694 reserved for service "rrimwm".
heartbeat: udpport setting must precede media statementsheartbeat[3208]: 2010/10/16_01:43:54 info: Version 2 support: resppawn
heartbeat[3208]: 2010/10/16_01:43:54 ERROR: Heartbeat not started: configuration error.
heartbeat[3208]: 2010/10/16_01:43:54 ERROR: Configuration error, heartbeat not started.

1694是我自己修改的,这个不是大问题,主要是 updport setting must precede media statements heartbeat[3208]
服务总是启动失败,最后查明原因是authkeys文件的问题,2个节点的这个文件不相同,建议这个文件用scp拷贝,手工修改可能会有问题,我就是手工修改的,折腾了半天,囧

关于HeartBeat的原理介绍,请参考http://www.linuxfly.org/

本文出自 “Fight For Free & Union” 博客,请务必保留此出处http://renpeng.blog.51cto.com/623897/412101
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: