Bosun报警语法
2018-03-10 16:33
4711 查看
bosun是常用的报警系统,通过配置metrics(items)图可以得到某一个参数在指定时间内的变化,比如设为10s,每隔10s就会去拉这个数据并画图,依据这个图可以实现对某些参数的监控,以此作为报警的依据。
大多数公司的基础架构组都会出一套完备的解决方案,但是核心甚至规则的自定义还是需要bosun语法,因此学习下。
基本的就是用q(xxx)来计算metrics图里面值的sum,count,change等等,并赋值给一个值,值的前面要带上$表示是一个变量, 具体语法可以参考这篇文章,写的很详细
举两个常用的例子
cpu:
avg(q(“sum:sys.cpu{host=xxx}”, “5m”, “”)) > 0.8
表示5分钟内cpu平均高于80%
error_log达到一定数量:
lognum=avg(q(“sum:rate:myservice.throughputlevel=ERROR|CRITICAL”,“5m”,“1m”))warn=lognum=avg(q(“sum:rate:myservice.throughputlevel=ERROR|CRITICAL”,“5m”,“1m”))warn=log_num > 1000
表示error和critical级别的log 1s注入超过1000
大多数公司的基础架构组都会出一套完备的解决方案,但是核心甚至规则的自定义还是需要bosun语法,因此学习下。
基本的就是用q(xxx)来计算metrics图里面值的sum,count,change等等,并赋值给一个值,值的前面要带上$表示是一个变量, 具体语法可以参考这篇文章,写的很详细
举两个常用的例子
cpu:
avg(q(“sum:sys.cpu{host=xxx}”, “5m”, “”)) > 0.8
表示5分钟内cpu平均高于80%
error_log达到一定数量:
lognum=avg(q(“sum:rate:myservice.throughputlevel=ERROR|CRITICAL”,“5m”,“1m”))warn=lognum=avg(q(“sum:rate:myservice.throughputlevel=ERROR|CRITICAL”,“5m”,“1m”))warn=log_num > 1000
表示error和critical级别的log 1s注入超过1000
相关文章推荐
- openTSDB/Bosun报警语法 介绍/学习笔记
- java语言语法基础
- C++ 简单代码,语法参照
- 20170113C++阶段班03_Object C++_08-09语法复习/Object复习
- SQL 中的语法顺序与执行顺序
- Scala学习教程笔记一之基础语法,条件控制,循环控制,函数,数组,集合
- C#语法糖(Csharp Syntactic sugar)
- jquery链式语法
- php:正则表达式的基本语法
- Zabbix使用外部邮箱服务器发送邮件报警
- 存储过程语法
- 什么是语法糖(转自BAIDU)
- 两个BAT脚本,为了记录里面的几个语法
- SPLUNK 安装配置及常用语法
- 用python实现NLP中的二元语法模型
- Java基础学习笔记七 Java基础语法之继承和抽象类
- hive 查看表结构语法
- linq 语法lambpa语法总结
- [Objective-C]-02-set get语法.类方法.self关键字与点语法
- 点语法的使用注意