最近做公司的监控系统做的比较累
2008-08-15 13:44
459 查看
作者: ecsun
链接:http://papa.javaeye.com/blog/228331
发表时间: 2008年08月15日
声明:本文系JavaEye网站发布的原创博客文章,未经作者书面许可,严禁任何网站转载本文,否则必将追究法律责任!
最近接手了公司的服务器监控部分的工作,一直忙于这方面工作的前期设计.
公司现在有200多台分布在全国各地的服务器,有应用的,有搜索引擎的,有数据库的,有缓存的,有web的,有wap的,等等等,这些服务器有时候不太听话,多多少少偶尔会搞出点意想不到的问题,而早先做的监控系统,又不能及时的响应这些问题,同时,明年服务器的数量要增加到大约2000台,所以就需要对这么多服务器进行全面的监控.规则设计新的监控系统对数量众多的服务器进行管理,势在必行.
而对于监控,我是一个新手,可以说一问三不知,早年学习的SNMP,CMIP之类的,早不知道忘记到哪里去了,重新查资料,翻手册,还好,网上多多少少有一些资料,但优秀的snmp的中文资料,实在是少之又少,找了大半天,在网上可以找到的关于snmp的中文资料,基本都收录到我的博客里了.
先大致描述一下要做什么吧.
1.监控公司各种搜索产品的运行状况,这些搜索产品包括,新闻啊,图片啊,mp3啊,铃声啊,游戏啊等等
2.监控公司各主要服务器的实时状态,这一块比较多,总的来说有cpu的,内存的,磁盘的,网卡的,网络连接数端口数的等等,总之服务器上可能出现问题的设备都要监控起来
3.监控公司各个数据库服务器的状态
4.监控服务上运行服务的运行状态
....
总之都是抓数据,抓状态,然后将状态实时的展现出来,如果哪一被监控的东东出了问题,要马上发出警报,邮件啊,短信啊,在线通知啊...就是要第一时间广播出去异常信息.公司员工手机要求24小时开机,哎,苦了这帮兄弟,监控千万别误报,要不每天都要打拢400来个兄弟姐妹的春秋大梦啊~
搞了两三个星期,总算有点头绪了,snmp部分的资料,搞的差不多了,对服务器状态的监控,靠它了.应用的,相对比较成熟,早期就已经实现的很好的,数据库服务器的,没问题,服务状态的,没问题了,下一步可以考虑一下怎么去实现的问题了.
有兄弟可能会说, cacti做的已经很好啊,干嘛要自己再发明一轮子,是啊cacti已经做的很好了,而且可以很容易的扩展 ,干嘛要再发明一轮子啊?实在不想用cacti,mrgt也可以啊?要不就snmpJ,哎,一言难尽,先折腾吧~
已有 8 人发表留言,猛击->>这里<<-参与讨论
JavaEye推荐
辉煌盛会-微软WinHec 2008 邀您共赴卓越
搜狐网站诚聘Java、PHP和C++工程师
链接:http://papa.javaeye.com/blog/228331
发表时间: 2008年08月15日
声明:本文系JavaEye网站发布的原创博客文章,未经作者书面许可,严禁任何网站转载本文,否则必将追究法律责任!
最近接手了公司的服务器监控部分的工作,一直忙于这方面工作的前期设计.
公司现在有200多台分布在全国各地的服务器,有应用的,有搜索引擎的,有数据库的,有缓存的,有web的,有wap的,等等等,这些服务器有时候不太听话,多多少少偶尔会搞出点意想不到的问题,而早先做的监控系统,又不能及时的响应这些问题,同时,明年服务器的数量要增加到大约2000台,所以就需要对这么多服务器进行全面的监控.规则设计新的监控系统对数量众多的服务器进行管理,势在必行.
而对于监控,我是一个新手,可以说一问三不知,早年学习的SNMP,CMIP之类的,早不知道忘记到哪里去了,重新查资料,翻手册,还好,网上多多少少有一些资料,但优秀的snmp的中文资料,实在是少之又少,找了大半天,在网上可以找到的关于snmp的中文资料,基本都收录到我的博客里了.
先大致描述一下要做什么吧.
1.监控公司各种搜索产品的运行状况,这些搜索产品包括,新闻啊,图片啊,mp3啊,铃声啊,游戏啊等等
2.监控公司各主要服务器的实时状态,这一块比较多,总的来说有cpu的,内存的,磁盘的,网卡的,网络连接数端口数的等等,总之服务器上可能出现问题的设备都要监控起来
3.监控公司各个数据库服务器的状态
4.监控服务上运行服务的运行状态
....
总之都是抓数据,抓状态,然后将状态实时的展现出来,如果哪一被监控的东东出了问题,要马上发出警报,邮件啊,短信啊,在线通知啊...就是要第一时间广播出去异常信息.公司员工手机要求24小时开机,哎,苦了这帮兄弟,监控千万别误报,要不每天都要打拢400来个兄弟姐妹的春秋大梦啊~
搞了两三个星期,总算有点头绪了,snmp部分的资料,搞的差不多了,对服务器状态的监控,靠它了.应用的,相对比较成熟,早期就已经实现的很好的,数据库服务器的,没问题,服务状态的,没问题了,下一步可以考虑一下怎么去实现的问题了.
有兄弟可能会说, cacti做的已经很好啊,干嘛要自己再发明一轮子,是啊cacti已经做的很好了,而且可以很容易的扩展 ,干嘛要再发明一轮子啊?实在不想用cacti,mrgt也可以啊?要不就snmpJ,哎,一言难尽,先折腾吧~
已有 8 人发表留言,猛击->>这里<<-参与讨论
JavaEye推荐
辉煌盛会-微软WinHec 2008 邀您共赴卓越
搜狐网站诚聘Java、PHP和C++工程师
相关文章推荐
- [导入]最近做公司的监控系统做的比较累
- 最近刚为公司完成的一款监视的小工具软件!用DELPHI 7 写的,可以从后台监控系统﹑键盘﹑鼠标﹑屏幕以及文件与目录!有源码!
- 为什么很多公司都自主开发监控系统?
- 我们公司最近需要采购一个视频系统,听说有个msvod视频系统挺不错,功能强大,不知道有没有免费版?
- 最近知道公司的bug管理系统是Mantis问题管理系统
- 各个监控系统比较
- 构建一个比较完善的监控系统 推荐
- 我公司研发的“GPRS无线数据采集监控系统”在北京、上海地区得到成功应用
- 最近去新公司用X5 框架开发系统 保存点代码
- 今天我对公司的WEB系统终于有了一个比较完美的交代!
- 说说公司最近正在部署大型高并发高负载电子商务网站的系统架构
- GIS系统开发报价哪些公司比较有优势?
- 公司IT全包,最近研究服务器运维,怎么能少了监控中心呢?
- 明晚九点|一线互联网公司服务器监控系统架构分享
- 说说公司最近正在部署大型高并发高负载电子商务网站的系统架构
- 最近给公司做个小系统核心功能由日历控件实现
- 本人最近公司,比较清闲,请教各位大侠,怎样才能接到外包项目,比较容易一点的。
- 最近发现系统rabbitmq丢消息比较严重,于是想了些方案来查找原因,给将消息发送方式添加确认机制。 我们在本地模拟了wms发送打标消息的场景. 1. 有事务 2. 先发点对点队列, 再发订
- 关于微软软件的操作系统在中国公司的比较性能测试-后果有很多后门木马因为微软没有打开系统的两个功能
- 为什么很多公司都自主开发监控系统?