维持数据服务系统稳定运行的三架马车
2012-12-08 09:25
204 查看
最近对影响系统稳定性运行的历史事件做了分析,可分为三类,解决不好就是三大杀手,解决好了就是三架马车。
一、数据源故障传导
如果说数据服务系统的数据是蛋糕,那么数据源系统就是在提供面粉和鸡蛋。面粉或者鸡蛋没来,蛋糕自然也就吃不上了。这个原因大约占50%。
二、人为因素
频繁变更、心情不佳、习惯不良、工作被打断,都会提高出错的可能性,大约占30%。
三、平台
操作人员误操作、程序没写好,都是挑战平台的健壮性的。虽然也可以归为人为因素,但是如果平台做得更好一些,问题可以规避。这一类问题,加上系统宕机、监控不当一类的问题,我都归结为平台因素,大约占20%。
总结:数据服务体系上下游延伸的链条很长,任何一个环节出现问题都有可能造成用户体验到系统不稳定的结果。又因为链条很长,所以导致系统不稳定的原因会千奇百怪,仅仅是发现一个解决一个是很难控制住的。表面上看人为因素也就是1/3,但是深度思考下去,数据源头和平台的背后也是人,归根到底还是“人性”占主要。这就需要有一名好的管理者,做好上下游沟通、控制好工作的节奏、为员工营造良好的工作氛围,人好了,系统也就跟着好了。
一、数据源故障传导
如果说数据服务系统的数据是蛋糕,那么数据源系统就是在提供面粉和鸡蛋。面粉或者鸡蛋没来,蛋糕自然也就吃不上了。这个原因大约占50%。
二、人为因素
频繁变更、心情不佳、习惯不良、工作被打断,都会提高出错的可能性,大约占30%。
三、平台
操作人员误操作、程序没写好,都是挑战平台的健壮性的。虽然也可以归为人为因素,但是如果平台做得更好一些,问题可以规避。这一类问题,加上系统宕机、监控不当一类的问题,我都归结为平台因素,大约占20%。
总结:数据服务体系上下游延伸的链条很长,任何一个环节出现问题都有可能造成用户体验到系统不稳定的结果。又因为链条很长,所以导致系统不稳定的原因会千奇百怪,仅仅是发现一个解决一个是很难控制住的。表面上看人为因素也就是1/3,但是深度思考下去,数据源头和平台的背后也是人,归根到底还是“人性”占主要。这就需要有一名好的管理者,做好上下游沟通、控制好工作的节奏、为员工营造良好的工作氛围,人好了,系统也就跟着好了。
相关文章推荐
- 系统连续稳定运行的关键
- 数据库每个表数据部分导出,保证系统正常运行
- windows下通过services.msc命令把某些服务停止引起系统运行异常的事宜
- 把任何可执行文件(包括批处理和脚本)当作系统服务运行的工具 下载
- Android获取当前系统正在运行应用及其数据流量
- 网站数据统计分析系统之采集服务部署
- 两种方法实现Windows系统服务自动运行SVN
- 让SVN作为windows系统服务自动运行
- 日志系统实战(二)-AOP动态获取运行时数据
- 日处理20亿数据,实时用户行为服务系统架构实践
- Android的Context && 安卓常用系统服务(当前运行包名/当前网络状态和开关网络/音频服务/马达服务)
- OpenRS—— 开放式遥感数据处理与服务平台 OpenRS-Cloude:基于MapReduce的并行遥感处理系统
- 手动优化Win7多余的系统服务提高WIndows7的运行速度
- 编写脚本程序用于监测系统服务http的运行状态
- 服务器稳定,打断点调试数据数据总为nil,但是再次运行NSLog的时候确实有数据的
- 优化系统服务提升Win7系统运行速度
- CentOS 7.x如何启动/关闭、启用/禁用服务? 修改系统运行级别
- 3.8 获取系统正在运行的服务
- 大数据IMF传奇行动绝密课程第35课:打通Spark系统运行内幕机制流程循环图
- android 一些系统自带的通知,服务,活动和数据