您的位置:首页 > 其它

Bosun报警语法

2018-03-10 16:33 4711 查看
bosun是常用的报警系统,通过配置metrics(items)图可以得到某一个参数在指定时间内的变化,比如设为10s,每隔10s就会去拉这个数据并画图,依据这个图可以实现对某些参数的监控,以此作为报警的依据。

大多数公司的基础架构组都会出一套完备的解决方案,但是核心甚至规则的自定义还是需要bosun语法,因此学习下。

基本的就是用q(xxx)来计算metrics图里面值的sum,count,change等等,并赋值给一个值,值的前面要带上$表示是一个变量, 具体语法可以参考这篇文章,写的很详细

举两个常用的例子

cpu:

avg(q(“sum:sys.cpu{host=xxx}”, “5m”, “”)) > 0.8

表示5分钟内cpu平均高于80%

error_log达到一定数量:

lognum=avg(q(“sum:rate:myservice.throughputlevel=ERROR|CRITICAL”,“5m”,“1m”))warn=lognum=avg(q(“sum:rate:myservice.throughputlevel=ERROR|CRITICAL”,“5m”,“1m”))warn=log_num > 1000

表示error和critical级别的log 1s注入超过1000
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: