Zabbix监控(十五):心跳检测Zabbix Server的存活状态
2014-11-21 16:57
453 查看
作用:为了防止zabbix server因意外原因不能工作,导致管理员没有收到报警邮件而不知道zabbix server是否运行正常,利用心跳检测来监控zabbix server本身的运行状态。
1、给Zabbix server添加一个Item
该Item主要作用是监控zabbix_server服务的默认端口10051或者zabbix_agentd的端口10050:
![](http://s3.51cto.com/wyfs02/M00/53/D9/wKioL1RylV3Db9iGAAJIM7iXjDU242.jpg)
2、添加触发器
跟以往的触发器不一样,这里设置的是当端口状态正常(listen)时触发:
![](http://s3.51cto.com/wyfs02/M02/53/DB/wKiom1RyloDDSVPbAAKrzFCooiY006.jpg)
3、添加动作
(1)把默认的内容删除,设置如下,不用勾上恢复项:
![](http://s3.51cto.com/wyfs02/M01/53/D9/wKioL1RylV3ijGAaAAGnuQv_bTk638.jpg)
(2)设置动作的条件,指定触发器状态为OK时执行动作:
![](http://s3.51cto.com/wyfs02/M01/53/DB/wKiom1RylN_hZd89AAKZeZKcZ4k554.jpg)
(3)设置动作详细
![](http://s3.51cto.com/wyfs02/M02/53/D9/wKioL1RylV7BojsQAAL-As-b_5U661.jpg)
说明:以往的step设置是from 1 to 1表示只在触发器触发的第一次执行动作,而这里from 1 to 0表示间隔一定时间执行动作,一直这样执行下去。
4、查看触发器状态
由于10055端口不存在,因此状态为PROBLEM:
![](http://s3.51cto.com/wyfs02/M01/53/D9/wKioL1RylV7CM2vIAAEEyV7e4Ow128.jpg)
5、修改Item
将端口修改成10050或者10051,使其触发器跳变到OK,从而触发动作的执行:
![](http://s3.51cto.com/wyfs02/M02/53/DB/wKiom1RylOCRtl8JAAEMc4svgnE470.jpg)
6、触发动作后查看邮件
Zabbix本身默认的邮件报警动作会发送触发器的故障和恢复邮件,本例设置的动作执行成功则会另发一封心跳检测邮件,标题就是前面设置的"Zabbix Server is running":
![](http://s3.51cto.com/wyfs02/M00/53/D9/wKioL1RylV7CZ7jqAAGl0znXuiE755.jpg)
7、观察心跳检测结果
为了更好的检查效果,将动作中的时间间隔设为1分钟,可以看到邮件接收效果:
![](http://s3.51cto.com/wyfs02/M00/53/DB/wKiom1RylODSaUVcAAH5VVp8MKM237.jpg)
结论:如果先设置触发器返回OK状态再设置Action,是不会发送邮件的,只有当触发器从PROBLEM跳变为OK时,才会触发动作;默认的动作是只在状态转换时发送一次邮件通知,心跳检测动作是可以按间隔时间一直发送的,这样就可以通过手机接收邮件,随时关注监控服务器是否运行正常。
本文出自 “月晴星飞” 博客,请务必保留此出处http://ywzhou.blog.51cto.com/2785388/1580965
1、给Zabbix server添加一个Item
该Item主要作用是监控zabbix_server服务的默认端口10051或者zabbix_agentd的端口10050:
![](http://s3.51cto.com/wyfs02/M00/53/D9/wKioL1RylV3Db9iGAAJIM7iXjDU242.jpg)
2、添加触发器
跟以往的触发器不一样,这里设置的是当端口状态正常(listen)时触发:
![](http://s3.51cto.com/wyfs02/M02/53/DB/wKiom1RyloDDSVPbAAKrzFCooiY006.jpg)
3、添加动作
(1)把默认的内容删除,设置如下,不用勾上恢复项:
![](http://s3.51cto.com/wyfs02/M01/53/D9/wKioL1RylV3ijGAaAAGnuQv_bTk638.jpg)
(2)设置动作的条件,指定触发器状态为OK时执行动作:
![](http://s3.51cto.com/wyfs02/M01/53/DB/wKiom1RylN_hZd89AAKZeZKcZ4k554.jpg)
(3)设置动作详细
![](http://s3.51cto.com/wyfs02/M02/53/D9/wKioL1RylV7BojsQAAL-As-b_5U661.jpg)
说明:以往的step设置是from 1 to 1表示只在触发器触发的第一次执行动作,而这里from 1 to 0表示间隔一定时间执行动作,一直这样执行下去。
4、查看触发器状态
由于10055端口不存在,因此状态为PROBLEM:
![](http://s3.51cto.com/wyfs02/M01/53/D9/wKioL1RylV7CM2vIAAEEyV7e4Ow128.jpg)
5、修改Item
将端口修改成10050或者10051,使其触发器跳变到OK,从而触发动作的执行:
![](http://s3.51cto.com/wyfs02/M02/53/DB/wKiom1RylOCRtl8JAAEMc4svgnE470.jpg)
6、触发动作后查看邮件
Zabbix本身默认的邮件报警动作会发送触发器的故障和恢复邮件,本例设置的动作执行成功则会另发一封心跳检测邮件,标题就是前面设置的"Zabbix Server is running":
![](http://s3.51cto.com/wyfs02/M00/53/D9/wKioL1RylV7CZ7jqAAGl0znXuiE755.jpg)
7、观察心跳检测结果
为了更好的检查效果,将动作中的时间间隔设为1分钟,可以看到邮件接收效果:
![](http://s3.51cto.com/wyfs02/M00/53/DB/wKiom1RylODSaUVcAAH5VVp8MKM237.jpg)
结论:如果先设置触发器返回OK状态再设置Action,是不会发送邮件的,只有当触发器从PROBLEM跳变为OK时,才会触发动作;默认的动作是只在状态转换时发送一次邮件通知,心跳检测动作是可以按间隔时间一直发送的,这样就可以通过手机接收邮件,随时关注监控服务器是否运行正常。
本文出自 “月晴星飞” 博客,请务必保留此出处http://ywzhou.blog.51cto.com/2785388/1580965
相关文章推荐
- zabbix用户自定义key检测内存信息和监控nginx的状态页
- Zabbix监控Server端数据库
- Zabbix3.0.2监控Mongodb性能状态
- 基于MINA实现server端心跳检测(KeepAliveFilter)
- Zabbix监控Nginx状态信息
- 运用Zabbix实现内网服务器状态及局域网状况监控(2) —— 环境配置
- Zabbix如何实现批量监控端口状态
- Zabbix调用python脚本监控mysql主从状态
- zabbix应用-监控mysql slave 主从状态 推荐
- 使用zabbix监控HAProxy的状态信息
- zabbix监控检测hbase的region一致性
- zabbix监控检测hbase的region一致性
- zabbix监控硬盘指标,tcp连接状态
- zabbix监控nginx状态
- 运用Zabbix实现内网服务器状态及局域网状况监控(5) —— Zabbix监控路由器
- zabbix监控elasticSearch集群健康值green yellow red状态
- zabbix监控elasticSearch集群健康值green yellow red状态
- zabbix监控tcp连接的状态
- zabbix监控tcp连接的状态