您的位置:首页 > 运维架构

Zabbix的item数据采集、tigger监控规则、action触发动作原理介绍

2016-11-23 11:49 1306 查看
一、zabbix的item数据采集

1、数据采集是zabbix的基础,也是监控基础,目前可以支持主动、被动两种采集模式。主动模式定义为:客户端主动上报数据到服务器端,被动模式定义为:服务器到客户端采集数据。

2、大家常用的是主动采集模式,主动采集方式除了zabbix自带的常用采集项,可以通过自定义采集项来进行扩展。例如需要做1个针对系统全流程的语义监控功能,就可以写一个脚本,通过自定义采集项来获取脚本执行的结果。

3、有时候部署agent比较麻烦,可以直接使用zabbix的trapper方式:被监控主机主动发送数据给zabbix server,通常可以应用于程序内部的异常消息采集。例如程序内部出现异常,抛出的异常消息可以通过trap方式发直接送给zabbix-server,通过trigger产生事件,通过action发送报警。

总结:整体来看zabbix对数据采集种类的支持还是比较丰富,但是配置起来相对复杂。

二、zabbix的trigger监控规则

1、监控规则是监控系统的核心,通过配置阈值来触发异常,产生事件,zabbix内置了很多规则。

2、通过trigger的Dependencies配置可以实现简单的事件关联依赖。例如:有两个trigger监控,1是监控www.linkedsee.com站点是否可访问、2是监控主机nginx 80端口是否可达。对于trigger1可以增加对trigger2的依赖条件,这样当nginx 80端口不可达,www.linkedsee.com站点也是不可访问的,但是不会触发产生www.linkedsee.com站点不可访问的异常事件。

3、基于以上设置,虽然可以实现简单的事件关联依赖合并,监控系统内部屏蔽了异常事件的产生,如果报警涉及多组运维人员,大家都希望可以看到自己的监控是否有异常。所以最好的方式还是所有异常事件都正常产生,在报警通知的时候进行关联分析。例如针对上述的例子,运维组A负责triiger1报警、运维组B负责trigger2报警,当trigger2异常时,通知运维组A【www.linkedsee.com不可访问,因为nginx 80端口不可达】,通知运维组B【nginx 80端口不可达,导致www.linkedsee.com不可访问】。

总结:zabbix有较全面的监控规则匹配表达式,当对于较复杂关联监控配置起来不够灵活。
 
三、zabbix的action触发动作

针对triiger触发的异常事件,可以触发相应的动作。通常的动作就是根据配置的media进行报警发送。Zabbix在报警配置这块,每种发报警发送方式都需要配置1个media,并且对每个用户都需要配置相应的发送media。

 

如果将zabbix的报警交给灵犀来管理,针对用户配置这块,只需zabbix上面配置1个user和1个media即可,会省事很多。

四、灵犀与zabbix的集成:

灵犀云告警是一款SAAS软件,专注于报警优化管理,提供多通道及时准确发送、多人智能分级发送、报警处理协同、故障数据多维度统计等功能。

对于zabbix监控系统(2.0、3.0都支持),如果需要使用灵犀对于报警优化的功能,只需要做以下步:

1、灵犀产品配置:

还没有灵犀账号,点击此处进行注册,完成引导页面后,进入工作台点击右下方的开启报警优化之旅,完成页面配置,复制token。

2、zabbix监控系统配置:

依次增加media、user、action就完成灵犀对zabbix的报警优化,具体图形操作可参考:http://www.linkedsee.com/standard/support#/access-zabbix。

 

 
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息