您的位置:首页 > 其它

雷鸣解答现场提问:如何解决硬件崩溃问题

2007-11-30 15:42 399 查看
中国最大的IT技术 社区CSDN联合美国权威IT技术媒体CMP集团,共同为中国百万开发者带来的国内最权威的 顶级软件技术大会----“2007 软件开发2.0技术大会”(SD2C)在九华山庄继续进行。

酷我公司创始人,美国Stanford大学的MBA学位和中国北 京大学的计算机硕士学位的雷鸣发表了题为“Linux系统下的高性能系统设计 ”的课程。课程之后,雷鸣留了不少的时 间给现场观众提问。

现场有观众问道“如果硬件出现问题比如主机坏掉系统怎么办?”

雷鸣表示这实际是很常见的问题,尤其在大规模的应用和架构中。当只有一台或者少数主机、硬件的时候,由于数量较少易于管理,而且从概率角度硬件出问题的可能性也比较小,所以我们通常不会遇到这个问题。但是大规模的系统由于硬件数量多,互操作等性能要求高,硬件问题是经常出现的。

那么如何解决这个问题呢?雷鸣给出了两条建议:

一是硬件永远不要满载,否则硬件崩溃就会出现雪崩效应。每个硬件或者主机都要保留一定的空间,当一台或者数台主机出现问题的时候,通过负载均衡等措施可以通过其他主机均衡掉任务。而且在处理问题的时候,要以产品的特点为主,比如用户体验性产品,在解决时首先要让用户感觉不到硬件出了问题。如果用户已经感觉到了,则在解决时首先解决用户体验问题。

二是监控,以防为主。及时得知系统是否出错,即不会影响用户的体验又可以有比较充裕的时间去解决。雷鸣现在的系统设有四层监控,而且会按照问题的不同等级以不同的方式来通知工程师。【呐不喊】



雷鸣,酷我公司创始人,美国Stanford大学的MBA学位和中国北京大学的计算机硕士学位,曾任百度公司的创始团队成员和首席架构师。现为酷我公司创始人,致力于整合互联网娱乐信息的公司。他的的主要产品,酷我音乐盒,已经有了大批的忠诚用户。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: