Linux下配置 Keepalived(心跳检测部署)
2017-02-14 16:25
113 查看
首先呢,我想先给大家简单介绍一下什么是keepalived:
Keepalived的作用是检测服务器的状态,如果有一台web服务器死机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。
大家了解到Keepalived是什么东西了之后,咱们就进入主题。
1.下载
http://www.keepalived.org/download.html
或
wget http://www.keepalived.org/software/keepalived-1.2.2.tar.gz
2.安装
tar -zxvf keepalived-1.2.2.tar.gz
cd keepalived-1.2.2
./configure --prefix=/home/wangpl/mine/soft/keepalived-1.2.2
make && make install
补充: 在大家进行./configure 有的机器会报错,这里为大家提供一个简单的解决方案。
1.遇到keepalived执行./configure --prefix=/usr/local/keepalived时报错:configure: error: Popt libraries is required
[python] view
plain copy
解决方法:
yum install popt-devel
安装好popt的开发包。
重新./configure 即可。
3.方式
安装到系统,默认的启动脚本里写的是系统路径,所以需要拷贝一些文件到系统目录下
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/rc.d/init.d/keepalived /etc/init.d/
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/sbin/keepalived /usr/sbin/
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/sysconfig/keepalived /etc/sysconfig/
$ mkdir -p /etc/keepalived/
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf
4.试用
进入目录 进行启动cd /etc/init.d/
启动:sh keepalived start
停止:sh keepalived stop
重启:sh keepalived restart
5. (主从模式)配置keepalived.conf
[python] view
plain copy
global_defs {
notification_email {
root@localhost
}
notification_email_from root@localhost
smtp_server localhost
smtp_connect_timeout 30
router_id NodeA
}
默认的配置文件中,使用第三方smtp服务器,但这在现实中几乎没有意义(需要验证的原因),我们将其指定为localhost, 将通知信息的发送交给本地sendmail服务处理。或者把其内容全部删除掉只留下router_id NodeA。查阅说明文档得知route_id配置是为了标识当前节点,我将其设置为NodeA。当然两个节点的此项设置可相同,也可不相同。
[python] view
plain copy
vrrp_instance VI_1 {
state MASTER #指定A节点为主节点 备用节点上设置为BACKUP即可
interface eth0 #绑定虚拟IP的网络接口
virtual_router_id 51 #VRRP组名,两个节点的设置必须一样,以指明各个节点属于同一VRRP组
priority 100 #主节点的优先级(1-254之间),备用节点必须比主节点优先级低
advert_int 1 #组播信息发送间隔,两个节点设置必须一样
authentication { #设置验证信息,两个节点必须一致
auth_type PASS
auth_pass 1111
}
virtual_ipaddress { #指定虚拟IP, 两个节点设置必须一样
192.168.200.16/24
192.168.200.17 /24 #这里的IP是一个本地
p; 192.168.200.18 /24 #这里的IP是另外一个连接的IP
}
}
按同样的方法配置节点B并修改配置文件,可将A节点的配置文件复制到B节点,并修改以下几项:
router_id NodeB
state BACKUP
priority 99
其它项不必修改。
测试及验证:
执行命令 ip a (注意ifconfig命令无法查看到配置的虚拟IP),来查看。
6.(主从模式)脑裂问题
上述主从配置方式存在脑裂的可能,即两个节点实际都处于正常工作状态,但是无法接收到彼此的组播通知,这时两个节点均强行绑定虚拟IP,导致不可预料的后果。
这时就需要设置仲裁,即每个节点必须判断自身的状态(应用服务状态及自身网络状态),要实现这两点可使用自定义shell脚本实现,通过周期性地检查自身应用服务状态,并不断ping网关(或其它可靠的参考IP)均可。当自身服务异常、或无法ping通网关,则认为自身出现故障,就应该移除掉虚拟IP(停止keepalived服务即可)。主要借助keepalived提供的vrrp_script及track_script实现:
在keepalived的配置文件最前面加入以下代码,定义一个跟踪脚本:
[python] view
plain copy
vrrp_script check_local { #定义一个名称为check_local的检查脚本
script "/usr/local/keepalived/bin/check_local.sh" #shell脚本的路径
interval 5 #运行间隔
}
再在vrrp_instance配置中加入以下代码使用上面定义的检测脚本:
[python] view
plain copy
track_script {
check_local
}
我们在/usr/local/keepalived/bin/check_local.sh定义的检测规则可以是:
以上的路径及文件是自己定义的。
a.自身web服务故障(超时,http返回状态不是200)
b.无法ping通网关
c.产生以上任何一个问题,均应该移除本机的虚拟IP(停止keepalived实例即可)
但这里有个小问题,如果本机或是网关偶尔出现一次故障,那么我们不能认为是服务故障。更好的做法是如果连续N次检测本机服务不正常或连接N次无法ping通网关,才认为是故障产生,才需要进行故障转移。另一方面,如果脚本检测到故障产生,并停止掉了keepalived服务,那么当故障恢复后,keepalived是无法自动恢复的。我觉得利用独立的脚本以秒级的间隔检查自身服务及网关连接性,再根据故障情况控制keepalived的运行或是停止。
这里提供一个思路,具体脚本内容请大家根据自己的需要编写即可。
脚本/usr/local/nginx/check_nginx.sh"内容:
[python] view
plain copy
#!/bin/bash
if [ "$(ps -ef | grep "nginx: master process"| grep -v grep )" == "" ]
then
/usr/local/nginx/sbin/nginx
sleep 5
if [ "$(ps -ef | grep "nginx: master process"| grep -v grep )" == "" ]
then
killall keepalived
fi
fi
//如果以上配置我介绍的不理解的话 大家参考一下实例代码。
vi /etc/keepalived/keepalived.conf
编辑文件(主):
[python] view
plain copy
global_defs {
router_id nginx_master
}
#监控服务.NGINX mysql等
vrrp_script chk_nginx {
script "/usr/local/nginx/check_nginx.sh"
interval 2
weight 2
}
vrrp_instance VI_1 {
state MASTER
interface eth0
virtual_router_id 51
priority 101
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.xx.xx #VIP(虚拟ip)
192.168.xx.xx #本机IP
192.168.xx.xx #另外一台IP<span></span>
}
track_script {
chk_nginx #检测脚本 上面配置的
}
}
vi /etc/keepalived/keepalived.conf
编辑文件(从):
[python] view
plain copy
global_defs {
router_id nginx_backup
}
#监控服务.NGINX mysql等
vrrp_script chk_nginx {
script "/usr/local/nginx/check_nginx.sh"
interval 2
weight 2
}
vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 51
priority 99
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.xx.xx #VIP(虚拟ip)
192.168.xx.xx #本机IP
192.168.xx.xx #另外一台IP
}
track_script {
chk_nginx #检测脚本 上面配置的
}
}
启动并测试:
1.启动两台机器上的nginx
2.启动两台机器上的keepalived
此时使用命令 ip addr 查看虚拟IP绑定 可以看到主 有,从没有,将主机的keepalived关掉,可以看到vip绑定到了从的上面。
Keepalived的作用是检测服务器的状态,如果有一台web服务器死机,或工作出现故障,Keepalived将检测到,并将有故障的服务器从系统中剔除,同时使用其他服务器代替该服务器的工作,当服务器工作正常后Keepalived自动将服务器加入到服务器群中,这些工作全部自动完成,不需要人工干涉,需要人工做的只是修复故障的服务器。
大家了解到Keepalived是什么东西了之后,咱们就进入主题。
1.下载
http://www.keepalived.org/download.html
或
wget http://www.keepalived.org/software/keepalived-1.2.2.tar.gz
2.安装
tar -zxvf keepalived-1.2.2.tar.gz
cd keepalived-1.2.2
./configure --prefix=/home/wangpl/mine/soft/keepalived-1.2.2
make && make install
补充: 在大家进行./configure 有的机器会报错,这里为大家提供一个简单的解决方案。
1.遇到keepalived执行./configure --prefix=/usr/local/keepalived时报错:configure: error: Popt libraries is required
[python] view
plain copy
解决方法:
yum install popt-devel
安装好popt的开发包。
重新./configure 即可。
3.方式
安装到系统,默认的启动脚本里写的是系统路径,所以需要拷贝一些文件到系统目录下
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/rc.d/init.d/keepalived /etc/init.d/
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/sbin/keepalived /usr/sbin/
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/sysconfig/keepalived /etc/sysconfig/
$ mkdir -p /etc/keepalived/
$ cp /home/wangpl/mine/soft/keepalived-1.2.2/etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf
4.试用
进入目录 进行启动cd /etc/init.d/
启动:sh keepalived start
停止:sh keepalived stop
重启:sh keepalived restart
5. (主从模式)配置keepalived.conf
[python] view
plain copy
global_defs {
notification_email {
root@localhost
}
notification_email_from root@localhost
smtp_server localhost
smtp_connect_timeout 30
router_id NodeA
}
默认的配置文件中,使用第三方smtp服务器,但这在现实中几乎没有意义(需要验证的原因),我们将其指定为localhost, 将通知信息的发送交给本地sendmail服务处理。或者把其内容全部删除掉只留下router_id NodeA。查阅说明文档得知route_id配置是为了标识当前节点,我将其设置为NodeA。当然两个节点的此项设置可相同,也可不相同。
[python] view
plain copy
vrrp_instance VI_1 {
state MASTER #指定A节点为主节点 备用节点上设置为BACKUP即可
interface eth0 #绑定虚拟IP的网络接口
virtual_router_id 51 #VRRP组名,两个节点的设置必须一样,以指明各个节点属于同一VRRP组
priority 100 #主节点的优先级(1-254之间),备用节点必须比主节点优先级低
advert_int 1 #组播信息发送间隔,两个节点设置必须一样
authentication { #设置验证信息,两个节点必须一致
auth_type PASS
auth_pass 1111
}
virtual_ipaddress { #指定虚拟IP, 两个节点设置必须一样
192.168.200.16/24
192.168.200.17 /24 #这里的IP是一个本地
p; 192.168.200.18 /24 #这里的IP是另外一个连接的IP
}
}
按同样的方法配置节点B并修改配置文件,可将A节点的配置文件复制到B节点,并修改以下几项:
router_id NodeB
state BACKUP
priority 99
其它项不必修改。
测试及验证:
执行命令 ip a (注意ifconfig命令无法查看到配置的虚拟IP),来查看。
6.(主从模式)脑裂问题
上述主从配置方式存在脑裂的可能,即两个节点实际都处于正常工作状态,但是无法接收到彼此的组播通知,这时两个节点均强行绑定虚拟IP,导致不可预料的后果。
这时就需要设置仲裁,即每个节点必须判断自身的状态(应用服务状态及自身网络状态),要实现这两点可使用自定义shell脚本实现,通过周期性地检查自身应用服务状态,并不断ping网关(或其它可靠的参考IP)均可。当自身服务异常、或无法ping通网关,则认为自身出现故障,就应该移除掉虚拟IP(停止keepalived服务即可)。主要借助keepalived提供的vrrp_script及track_script实现:
在keepalived的配置文件最前面加入以下代码,定义一个跟踪脚本:
[python] view
plain copy
vrrp_script check_local { #定义一个名称为check_local的检查脚本
script "/usr/local/keepalived/bin/check_local.sh" #shell脚本的路径
interval 5 #运行间隔
}
再在vrrp_instance配置中加入以下代码使用上面定义的检测脚本:
[python] view
plain copy
track_script {
check_local
}
我们在/usr/local/keepalived/bin/check_local.sh定义的检测规则可以是:
以上的路径及文件是自己定义的。
a.自身web服务故障(超时,http返回状态不是200)
b.无法ping通网关
c.产生以上任何一个问题,均应该移除本机的虚拟IP(停止keepalived实例即可)
但这里有个小问题,如果本机或是网关偶尔出现一次故障,那么我们不能认为是服务故障。更好的做法是如果连续N次检测本机服务不正常或连接N次无法ping通网关,才认为是故障产生,才需要进行故障转移。另一方面,如果脚本检测到故障产生,并停止掉了keepalived服务,那么当故障恢复后,keepalived是无法自动恢复的。我觉得利用独立的脚本以秒级的间隔检查自身服务及网关连接性,再根据故障情况控制keepalived的运行或是停止。
这里提供一个思路,具体脚本内容请大家根据自己的需要编写即可。
脚本/usr/local/nginx/check_nginx.sh"内容:
[python] view
plain copy
#!/bin/bash
if [ "$(ps -ef | grep "nginx: master process"| grep -v grep )" == "" ]
then
/usr/local/nginx/sbin/nginx
sleep 5
if [ "$(ps -ef | grep "nginx: master process"| grep -v grep )" == "" ]
then
killall keepalived
fi
fi
//如果以上配置我介绍的不理解的话 大家参考一下实例代码。
vi /etc/keepalived/keepalived.conf
编辑文件(主):
[python] view
plain copy
global_defs {
router_id nginx_master
}
#监控服务.NGINX mysql等
vrrp_script chk_nginx {
script "/usr/local/nginx/check_nginx.sh"
interval 2
weight 2
}
vrrp_instance VI_1 {
state MASTER
interface eth0
virtual_router_id 51
priority 101
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.xx.xx #VIP(虚拟ip)
192.168.xx.xx #本机IP
192.168.xx.xx #另外一台IP<span></span>
}
track_script {
chk_nginx #检测脚本 上面配置的
}
}
vi /etc/keepalived/keepalived.conf
编辑文件(从):
[python] view
plain copy
global_defs {
router_id nginx_backup
}
#监控服务.NGINX mysql等
vrrp_script chk_nginx {
script "/usr/local/nginx/check_nginx.sh"
interval 2
weight 2
}
vrrp_instance VI_1 {
state BACKUP
interface eth0
virtual_router_id 51
priority 99
advert_int 1
authentication {
auth_type PASS
auth_pass 1111
}
virtual_ipaddress {
192.168.xx.xx #VIP(虚拟ip)
192.168.xx.xx #本机IP
192.168.xx.xx #另外一台IP
}
track_script {
chk_nginx #检测脚本 上面配置的
}
}
启动并测试:
1.启动两台机器上的nginx
2.启动两台机器上的keepalived
此时使用命令 ip addr 查看虚拟IP绑定 可以看到主 有,从没有,将主机的keepalived关掉,可以看到vip绑定到了从的上面。
相关文章推荐
- Linux下配置 Keepalived(心跳检测部署)
- Linux下配置 Keepalived(心跳检测部署)
- Linux下配置 Keepalived(心跳检测部署)
- Linux下配置 Keepalived(心跳检测部署)
- linux下keepalived的配置(心跳检测机制)
- Hadoop linux(ubuntu)分布式部署配置问题记录
- Hadoop linux(ubuntu)分布式部署配置问题记录
- Linux上Java JDK环境的部署和配置
- Linux 下Tomcat部署 及 将Tomcat配置成服务
- 实例解析 Linux操作系统NFS配置部署过程
- Linux:Tomacat安装配置,项目部署
- [Linux]在Linux上部署Java开发环境笔记(一)-- 补充:Linux下如何手动设置IP及配置DNS服务
- Linux下SVN部署/安全及权限配置,实现web同步更新
- Linux下MySQL+Keepalived高可用性配置
- Linux:Tomacat安装配置,项目部署
- Linux下SVN部署/安全及权限配置,实现web同步更新
- Hadoop linux(ubuntu)分布式部署配置问题记录
- Jetty的配置、部署与API使用——(3)Linux下利用Jetty API运行一个Jetty服务器
- [Linux]在Linux上部署Java开发环境笔记(一):虚拟机安装Linux,配置Linux和主机XP能互Ping成功
- Linux+Django+Python+Wsgi配置过程 Linux下配置Apache+Mod_Wsgi+Django环境 部署django项目