您的位置:首页 > 运维架构 > 网站架构

【专题二】虚拟化到底在提升还是破坏服务器及IT基础架构的可靠性?――虚拟化可靠性遭遇挑战

2010-08-31 19:28 585 查看
参与调查:是什么影响了您虚拟化的的进程

软件是灵活、变化和快速发展的,经常超过它运行于的硬件的负荷。硬件的性质是更刻板的,变化比较缓慢。对于大多数计算机用户来说,根据他们使用的硬件和软件组合,这个区别意味着他们有时候会遇到性能不佳的问题或者不能使用某些功能。然而,当涉及到这个问题的软件智能是虚拟化的时候,这个赌注是很高的。




由于虚拟化的基本好处是能够在每一台物理服务器上运行多个应用服务器,在基于服务器的架构最大限度地减少故障点多年之后,虚拟化将重新给IT基础设施带来单个的故障点。分布式服务器架构通过在一个单独的物理服务器上运行重要的应用程序来阻止整个系统的故障。服务器崩溃只能同时断开一个或者二个重要的资源。这是分布式环境比它们取代的大型计算机或者微型计算机容忍较低的服务器可靠性的原因。然而,随后发生的数据中心蔓延通过虚拟化给服务器架构带来了一些周折。由于在一台服务器上运行5个、6个、7个或者更多的重要应用程序和数据库,虚拟化的IT环境比大型计算机和微型计算机环境更容易遭到灾难性崩溃的破坏,因为它们有同样集中的资源,但是,硬件的可靠性不同。

  当然,这些都不是搁置虚拟化战略的理由。虚拟化的好处太大了,不能被忽略。企业IT经理已经在积极地采用虚拟化技术控制数据中心蔓延。根据市场研究公司Yankee Group的调查,将近80%的接受调查的企业正在使用某种类型的虚拟化技术。85%的虚拟化软件开支应用于服务器整合项目。据Yankee Group的2007年服务器虚拟化报告称,在一台物理服务器上运行多个虚拟服务器把每台服务器的利用率从10%提高到了80%。对于那些注重形象的公司来说,虚拟化技术还不会很快应用。《纽约时报》引述McKinsey & Co公司的研究报告预测称,到2020年,数据中心将成为最大的温室气体制造者。

  要实现自己的全部潜力,虚拟化必须要与可靠性战略一起应用。可靠性战略考虑到自己的弱点并且用正确的硬件和管理策略减少这些弱点来解决这个问题。
没有内置虚拟化的可靠性

  可靠性和业务持续性在虚拟化讨论中并不是主要考虑的问题。忽略这个问题的部分原因是由于虚拟化的性质。在一个虚拟环境中建立多个应用服务器的方便性能够让虚拟化看起来就像是自己的可靠性战略。在虚拟服务器上备份应用程序的副本意味着在一台服务器崩溃的时候还有一个备份的应用程序能够运行。由于备份的应用程序副本随时准备运行,IT部门在一旦发生应用程序崩溃的时候就不会手忙脚乱。

  然而,这个想法有两个问题。第一,在不同的机器上建立虚拟服务器能够部分地防止硬件故障并且避免了进行升级、使用补丁等工作所需要的计划的关机时间。这不能避免没有计划的关机时间。当物理服务器崩溃的时候会出现什么情况?多个虚拟应用服务器不能阻止断电故障、风扇损坏引起的过热、硬盘故障等问题。在常规的IT环境中,一台由于上述原因或者其它原因崩溃的服务器能够中断一个重要的应用程序并且影响到与这个应用程序有关的其它操作。相比之下,在一个虚拟化的环境中,每一台服务器都将支持5个至10个重要的应用程序。考虑一些这个区别。在常规环境中的一台服务器的崩溃可以中断一个客户的数据库。这仅仅是一个问题。在虚拟环境中的一台服务器崩溃可能中断这个客户的数据库、电子邮件系统、文件服务器、电子商务系统和财务应用程序。这是一个灾难。

  Yankee Group发表的2007年“服务器虚拟化为容错服务器创造了新的机会”的报告称,一般人都说不要把鸡蛋都放在一个篮子了,以防止这个篮子发生不测。企业现在正在使用虚拟化技术整合自己的基础设施。然而,担心的问题是减少硬件和在较少的服务器上运行更多的重要应用程序,单个的故障点会再一次出现。

  第二,即使物理服务器没有崩溃,多个虚拟机也不能保证业务的持续性。IT部门需要一些时间让备份的虚拟应用服务器上线运行,尽管这个过程是自动的。在这个容错时间里,没有数据搜集、没有处理流程,服务器崩溃时正在传送的交易处理会丢失。

  如果虚拟化环境成为标准,企业IT部门就需要考虑虚拟化能够提供的功能以外的业务持续性。这就意味着这个战略将包括从集群到容错服务器在内的所有的可用性技术。对于非重要的资源,集群和日益增多的建在虚拟化软件中的可靠性功能等可用性解决方案能够提供足够的运行时间和恢复。然而,重要的应用程序和数据需要持续不断的可用性解决方案,如容错服务器等。容错服务器实际上是一台机器中有两台服务器,以密集连锁的步伐运行,每一台服务器都传送处理的工作量,在一旦发生故障的时候不会中断。在大量的金钱甚至生命都以来连续运行的应用程序的时候,没有任何方法能够取代容错技术。

多层次的可靠性战略

  Kansas City Terminal(KCT)铁路公司是要求虚拟化的效率和更便宜地运行主要的新软件的公司之一。然而,与许多企业不同,KCT在采用虚拟化战略的同时还采用了可用性战略。

  KCT在运营中不允许出现错误。这个美国第二大的铁路枢纽在堪萨斯州和密苏里州的85英里的铁路上每天发送350列火车。一个交换机的错误意味着销售收入的损失,每个小时将付出数百万美元的额外经营开支,计划延迟在整个美国将持续几个星期。当KCT推出自己的虚拟化的ECIS(企业控制和信息系统)时,这个系统是在容错硬件服务器上运行的,把每年意外关机时间减少到了几秒钟。

  KCT的IT管理公司Railware在一台容错服务器上创建了一个虚拟Windows 2003服务器,用于应用程序逻辑、SQL服务器和前端处理器功能。这个虚拟的环境取代了一个服务器密集型的架构。在这个架构中,每一个应用程序都在自己的Windows 2003服务器上运行。转换到虚拟化的基础设施减少了运营开支、简化了KCT公司的IT基础设施并且消除了KCT网络中的一些故障点。然而,据 Railware总裁Ross Pirtle说,在没有的得到Railware公司的保证说这个系统不会出现意外的关机时间之前,KCT公司官员还是不会批准这个项目。

  Pirtle称,我们为KCT公司做这个事情充满了信心,因为容错硬件和VMware公司的虚拟化软件提供了极高水平的可靠性。我们不是另外制造一个虚拟化的系统。自从采用这个虚拟化系统以来,KCT公司的意外关机时间为零。

  KCT公司的战略显示了可靠性战略与虚拟化项目一起实施如何能够产生一个经济的、有效的和灵活性的IT环境。这个事情还表明,采用以前的大型机/微机可靠性的架构并不意味着自动拥有大型机/微机的那种可靠性。

更多精彩内容请关注:
IBM虚拟化与云计算官方微博

IBM虚拟化与云计算官方网站
目前已经有376名粉丝在关注虚拟化与云计算大会,期待您的加入!即可获得更多IBM的虚拟化与云计算内部资料,参与9月3日虚拟化与云计算大会现场直播和问答,参加抽奖活动赢IT热书《虚拟化与云计算》。

如果您目前还没有开通微博,您可以:
1. 注册成为新浪微博用户

2. 访问虚拟化与云计算的官方微博

3. 加关注,成为我们的粉丝

4. 收藏虚拟化与云计算大会页面,9月3日我们再见!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐