您的位置:首页 > 职场人生

CDP解决方案中的关键因素

2009-05-14 15:41 471 查看
戴文军 在跟客户交流的过程中,我们发现很多CTO对CDP(Continuous Data Protection,连续数据保护)存在一些疑问,到底实施CDP给公司带来多大的价值?是否值得投入那么多人力和物力来实施? 我们认为CDP的实施取决于公司定义的信息系统灾难恢复能力等级,具体量化为灾难恢复的时间范围,即RTO(Recovery Time Objective,恢复时间目标)和RPO(Recovery Point Objective,恢复点目标)。 信息系统灾难恢复能力等级与RTO和RPO具有一定的对应关系,各行业可根据行业特点和信息技术的应用情况制定相应的灾难恢复能力等级要求和指标体系,可以参考国标《信息安全技术与信息系统灾难恢复规范》中定义的三者之间的关系示例。

[align=center]表 1 RTO/RPO与灾难恢复能力等级的关系[/align][align=center] [/align] 按照灾难恢复能力等级的定义,传统备份只能够达到3到4级。如果企业需要达到5、6级的恢复能力,那么,用户可以考虑使用CDP解决方案了。CDP定义 CDP技术目前处于发展阶段。业界对CDP的准确定义并不一致,这也是用户比较困惑的原因之一。笔者支持并采用SNIA(Storage Networking Industry Association,全球网络存储工业协会)的定义:持续数据保护是这样一种在不影响主要数据运行的前提下,可以实现持续捕捉或跟踪目标数据所发生的任何改变,并且能够恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标的无限的任意可变的恢复点。CDP的关键因素 用户在选择CDP产品时,应从自身需要选择合适的产品,主要需要考虑以下几大关键要素。 CDP解决方案的设计方法 CDP解决方案分为三个级别,有Block-based、File-based、Application-based,如图1所示。用户针对不同的应用选择合适的CDP解决方案。

  Block-based CDP 位于物理存储或逻辑卷管理层之上。当数据块被写入主存储器时,写入的数据副本就被CDP系统捕获并存储到一个独立区域中。Block-based CDP适合于那些拥有庞大的关键性业务的作业系统,特别是那些拥有跨平台数据库系统的企业和机构部署。 File-based CDP则位于文件系统之上,它可以捕获文件数据或者元数据改变,比如文件创建、修改、删除等。File-based CDP在获取到这些消息时对相应文件进行备份。 相对Block-based CDP而言,File-based CDP是轻量级的,但其优势比较明显。File-based CDP可以根据需求直观地将单个文件恢复到之前的任一版本,而Block-based CDP则需要恢复整个磁盘或分区,恢复点不明确。File-based CDP恢复时间较短,效率较高。 不同公司的File-based CDP产品的最大区别在于文件的备份策略。对于备份,目前市场上大部分产品实现形式都是采用文件复制的策略。此方式带来了备份端容量无限制增大和带宽占用较多的弊端。为了将文件恢复到以前某个状态,在备份端需要保存文件的多个版本。也就是说,一个400MB的文件在只改变了1KB数据情况下,需要重新拷贝并保存400MB的数据。目前只有很少的公司实现了文件级的增量备份。 Application-basedCDP在系统层面安装应用程序代理,提供深层次的集成。作为应用自身的内置功能,也可以是利用特殊的API接口,取得连续访问应用内部状态的权限。在应用程序数据发生改变时, 通过代理感知,协调应用程序进行备份。TrueCDP与NearCDP CDP连续数据保护分TrueCDP和NearCDP两种,其在实现方式上有较大差别。True CDP一般通过快照加IO日志的方式实现,Near CDP则更多地是使用连续快照的方式。目前对两者没有严格的定义,可以从RPO的角度进行区分。将数据恢复到任意一个时间点的连续数据保护称为True CDP,将数据恢复到一个很短的时间间隔之前的连续数据保护称为Near CDP。 Near CDP一般通过快照实现,由于Windows和Linux下的快照次数有限,不能做到实时的数据保护。尽管如此,Near CDP相对于True CDP有以下优点。首先,Near CDP在备份时可以减轻服务器相当大的负担;其次文件级的Near CDP根据文件的创建、保存、关闭等动作进行备份,具有比较清晰的备份恢复点,更为重要的是应用成本比较低,这对于业务连续性要求并不太严格的用户来说是一个合理的选择。 相对而言,True CDP可以恢复到任意时间点,可以满足银行、证券等对数据安全要求非常苛刻的用户需求。True CDP对硬件和软件都有比较高的要求,投入较大。InBand 与OutBand 从目前主流的CDP产品来看,可以两种形式来实现对存储的数据保护:直接位于主机服务器和存储设备的数据通道中间(In-Band),或是位于数据通道之外(Out-Band),这种形式仅仅向主机服务器传送一些控制信息,来完成物理设备和逻辑卷之间的地址映射。 In-Band虚拟化引擎位于主机和存储系统的数据通道中间,控制信息和用户数据都会通过它,而它会将逻辑卷分配给主机,就像一个标准的存储子系统一样。如图2所示。 

方案缺点:难于扩展; 延迟增加;高带宽要求; 读取磁盘中的数据加以远程传递,因此容易造成缓存中的数据丢失;性能受到一定影响;扩展性有限,有单点故障。 方案优点:这种数据复制方式与服务器平台以及存储厂家无关;主机端无须任何配置,安全性高,成本低;打破储存设备间的不兼容,以及解决方案多元化的弊端。 Out-Band虚拟化引擎物理上不位于主机和存储系统的数据通道中间,而是通过其他的网络连接方式与主机系统通讯。于是,在每个主机服务器上,都需要安装客户端软件,或者特殊的主机适配卡驱动。存储的配置和控制信息有虚拟化引擎负责提供,如图3所示。

  方案缺点:无瓶颈,全 Fabric 带宽,高可扩展性,高可用性,低成本,打破储存设备间的不兼容,从现有的SAN无缝地迁移。 方案优点:实施难度比In-Band方式大,可以不改变原有存储体系架构,可以提供解决方案的厂商较少,与硬件关联比较大。其他需要考虑的因素 带 宽 CDP解决方案一般都是基于网络架构的,直接决定着CDP恢复速度。所以需要用户提供较大的网络带宽以便在原有存储系统和CDP存储服务器之间传输数据。 安全性 CDP提供了很快的恢复速度,但同时必须保证只有合法用户在授权情况下将数据恢复到制定的机器上。只有保证用户只处理权限范围内的数据,才能不至于将CDP的灵活性变成安全威胁。 经济性 如何实现有限投资下的多应用保护?需要为不同的数据制定不同的保护策略。因为CDP大约需要1.2倍的原有存储空间作为备份,同时需要较大带宽,所以只有对关键数据采用CDP解决方案比较合理。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  职场 CDP 休闲