您的位置:首页 > 运维架构

仪表盘 hostmap 新玩法让运维工作越玩越 high

2016-03-23 12:04 281 查看
Cloud Insight 第13次新品发布会现在开始,首先非常感谢大家前来看我们的新功能发布会,下面我先给大家介绍一下新功能,之后有什么问题大家尽管问��。

新功能

Cloud Insight 发布 4.4.0 版本,主要增加以及修复以下功能:

增加仪表盘标记线

增加仪表盘数据表现形式

增加仪表盘 rate 指标

增加 hostmap 无限分组功能

增加端口监控,进程监控

修复 Windows 平台显示问题

仪表盘是什么?

天啊,互联网时代有人连这个都不知道,好吧,既然这样那我来解(an)释(li)一下,仪表盘就是汽车上显示转速表,里程表,机油,,,,balabala。��不开玩笑,我们是一个严肃的产品,仪表盘其实是将你关心的所有数据用图表这种更直观的形势展现出来的一种表现形式。

再说简单点,就是你今天想统计一下敲了多少下键盘,点击了多少下鼠标,看下面这个图就明白啦!



这个仪表盘和运维有什么关系?

好问题,这个问题问的很有水平嘛!举一个最简单的场景:5 台 MySQL 数据库平常 5000 连接,如果突然间整体访问量剧增,这个时候你需要知道每台服务器数据库访问情况,整体访问情况,整体增长情况。

用仪表盘可以设2个表盘,一个是显示5台服务器各自访问连接情况,一个显示总体访问连接情况,当然要想更全面的确认访问量剧增是出现攻击还是真的有很多用户访问,还要加上其他数据库操作的监控指标。

有人用这仪表盘吗,或者这个仪表盘有具体使用实例吗?

这个当然有啊,就说那个监控北京空气质量 监控不同地区 PM2.5 的应用,监控天气的 APP 不少,现在是个应用估计都有这个功能,但如果把这类数据投放在大屏幕上,让公司同事随时都能看到这个关乎生命的实时数据指标,那简直就是一件利国利民的好事啊��,毕竟在雾都生活还是很不容易的。

还有那个极具极客范儿的 监控闭路电视的硬盘空间也是用仪表盘展示数据的,具体代码可以看 github 上
monitor-harddisk
项目。

对了还有业务层面的 SDK实现业务响应速度监控,监控 Nginx php 的响应时间,什么监控数据,应用数据,仪表盘统统搞的定。



上面说的仪表盘增加表现形式和 rate 指标具体指什么?

我们4.4.0之前的版本仪表盘只有3种表现形式,都是图表的,就是上图那种折线图,面积图,以及柱状图,现在增加了数值型的表现形式。

图表格式对于数值趋势走向以及历史对比更为直观,纯数字格式更适合看此时具体数据,如下图图二,把指标名称的具体数据列出来,当然,还有更加直观的图三,你可以设置数据在什么位置,数值在什么区段显示什么颜色,背景显示什么颜色,例如可以这样设置:内存使用率低于70%时是绿色的,70%~80%橙色,80%以上红色等等,有点小告警的意思啊。



还有增加了一个 rate 指标,这个就像上图图一中
system.cpu.idle
这个指标,开启 rate 指标显示,就会增加一个计算斜率的数据。

例如我们每周活跃用户要求增长8%,把每周的日活数据放上去,根据每周日活数据,开启 rate 指标计算,看是不是达标。。。。。写上这些好辛酸。

Hostmap 是什么?

Hostmap 是你可以在一个屏幕上看到所有主机情况,根据颜色分辨主机是 up 还是 down ;通过 tag 你想分组,过滤,随意;宏观上发现哪个组件监控出问题,发现异常,及时处理并且避免资源浪费。通过 Hostmap 你可以轻松管理1000台服务器,10000台服务器,下图是通过
地区
信仰
分组后的结果:



那么 tag 是。。。。��好像越扯越远啦,具体含义参见 tag,简单来说就是通过
key:value
格式给不同主机加上标签,上图的一些 tag 就是
地区:海之角
信仰:基督教
等等之类的。上述指标纯属杜造,和事实有什么差距概不负责哦!(那个羊教实在被好多人吐糟)

还有还有。。。

还有我们的仪表盘标记线,端口监控,进程监控等功能在这就不多介绍了,留点小神秘,曝光过度被人抄了怎么办(原谅有被迫害妄想症的我),其实从名称上也能猜到几分吧,想看更多功能介绍,参考 Ci 文档,自己注册一个玩一下就知道啦,实在技痒的话玩玩我们 SDK 吧!

强行拉回主题

说了上述这么多功能,还觉得运维无聊吗?如果以前是的话那是你没找到给力的工具,所以才感觉运维工作无聊。经常在运维群里听人说:运维嘛,平时上班也没什么事,搭好监控不出什么问题就行了,其他时间就学学新技术,要么就是在群里和大家神侃。。。对于这种工作态度,我想说的是,侃的时候放上上面几张图来展示自己的成果是不是装 X 加分了呢?



Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。想阅读更多技术文章,请访问 OneAPM 官方技术博客

本文转自 OneAPM 官方博客
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息