您的位置:首页 > 其它

重复数据删除技术将代替应用软件自带备份策略

2010-02-22 15:11 519 查看
【IT专家网独家撰稿】到目前为止,重复数据删除技术在存储领域内的应用主要包括两块内容,分别为数据备份和普通存储。不过用在普通存储方面的产品还是不多见,主要是用在数据备份。在某个程度上讲,有了重复数据删除技术在备份上的应用,一些应用软件自带的备份策略可以“休息”了。这主要是因为重复数据删除技术可以提供更大的备份容量、更好的数据服务水平等等。

  一、重复数据删除技术完全可以实现完全备份。

  以Oracle数据库为例,其备份包括完全备份与增量备份。通常情况下,完全备份是对数据库中的所有数据进行备份,其备份时间比较长,但是恢复的时间比较快,因为只需要用到一个备份文件。而增量备份是指对上一次备份以后的变动的数据进行备份。其特点是备份的时间比较短,但是恢复的时间比较长,因为需要用到多个备份文件。在实际工作中,管理员往往采用的是完全备份与增量备份结合的方式。如每个星期天执行一次完全备份,从星期一到星期六执行一次增量备份。在缩短备份时间的同时,在一定程度上也可以提高数据恢复的效率。但是如果星期五发生数据丢失,要恢复星期四的数据时,其仍然需要用到多个备份文件(上个星期日的完全备份文件、星期一到星期四的四个增量备份文件)。故数据恢复起来,仍然没有采用完全增量备份文件难么快(此时只需要用到一个完全增量备份文件)。【IT专家网独家撰稿】

  而不过在备份策略中采取了重复数据删除技术,则这种情况会有所改观。如在针对Oracle数据的备份中,由于以磁盘为介质的备份设备具有比较高的性能和在线重复数据删除功能。所以即使每天对Oracle数据库进行完全备份,也只需要使用少量的存储空间,其在备份上所花的时间也比较短。只要管理适当,用户每天进行完全备份与进行增量备份在空间与时间上基本上相同。【IT专家网独家撰稿】

  所以对企业应用软件的数据进行备份时,采用重复数据删除技术的备份设备可用完全备份来替代增量备份。如此的话,即不会增加多少的存储空间或者影响备份的效率,而且万一发生故障时数据恢复起来也会快许多。可见,重复数据删除备份设备完全有可能代替软件自带的备份策略。【IT专家网独家撰稿】

  二、端到端的验证过程提高了备份数据的安全性。

  虽然现在不少应用软件,如数据库、邮件系统等等,都自带有备份策略。但是这个备份策略有一个缺陷,就是很难进行备份数据的可持续验证。如用户对某个数据库进行了完全备份或者增量备份之后,怎么来判断这个备份文件是可以用的呢?用户可能只有再下次故障时对数据进行恢复,才可以判断这个备份文件是否可用?但是,到那个时候已经迟了。应用软件在对数据进行备份的过程中,由于软件缺陷或者其他一些意外原因,可能会导致写入错误的数据。此时就会破坏备份文件的数据块指针、位图等等。从而导致后续在数据恢复的时候,出现致命的错误。【IT专家网独家撰稿】

  为了避免这种情况,有两种方法。一是在卸载文件系统后对备份文件进行检查,如运行文件系统检查程序。这个方法有一定的局限性。如管理员不会每次备份完成后都去卸载一下文件系统进行检查。这会影响到应用系统的可用性。同时这个检查也能够发现一些常规的错误。通常情况下对于备份数据,在对数据进行恢复测试之前,是很难发现隐藏在其中的错误的。第二种方法就是如果能够实现对备份数据实现端到端的验证过程,那么就可以确保备份文件的可用性。而现在大部分的重复数据删除设备都具有端到端的验证技术。所以采用重复数据删除设备来备份数据,可以提高备份数据的安全性。相对来说,比起应用软件自带的备份策略来说,重复数据删除设备要安全的多。现在不少企业对于关键数据的备份,采用的都是重复数据删除设备,而放弃了系统自带的备份策略;或者只是将其作为一个辅助。【IT专家网独家撰稿】

  三、相同容量下可以存放更多的数据。

  在传统的备份中,往往采取的是完全备份与增量备份的方式。但是无论是完全备份还是增量备份,则包含着很多冗余数据。完全备份不用说。在增量备份中虽然只是备份那些有变化的文件,但是仍然会包含冗余的数据块。

  笔者以前做过一个测试。对于同样的数据,如果采用完全备份的话(连续三天),可能需要60G的存储空间。而采用增量备份的话,连续三天需要的存储空间为25G左右。重复数据删除设备进行备份的话,其需要空间为22G。可见,在相同容量下,采取重复数据删除技术可以保存更多的数据。一般情况下,于完全备份相比,使用重复数据删除技术的备份设备全备份时,其可以节省95%左右的存储空间。这是一个很可观的数值。【IT专家网独家撰稿】

  为什么都是完全备份,只是采用的技术不同,会有这么大的差异呢?这主要是因为重复数据删除技术只保存唯一一份备份数据的数据段。即当数据写入到备份设备的时候,属于据会被分割成可变长度的数据段。在写入之前,重复数据设备会实时的将这个数据段与已经存在的数据段进行比较。如果相同的话,则会丢弃。不同的话则写入。通过这个方式,就能够保证每个唯一的数据段只保留一份。所以即使连续三天的完全备份,其存储的备份文件中仍然没有重复的内容。故可以大幅度的节省磁盘空间。【IT专家网独家撰稿】

  通常情况下,重复数据删除设备可以在文件或者文件夹间,甚至在数据块内发现重复的文件和数据段,所以在数据备份时,所需要的存储空间也就比所要保存的数据量低一个数据量级。那么到底可以降低多少呢?则除了跟数据的重复率有关,而且还跟其算法有密切的关系。为此采用不同的算法,其可节省的磁盘空间是不同的。不过可以肯定的一点是,无论是数据库还是文件服务器,采用重复数据删除设备在进行数据备份时,都可以节省磁盘空间。特别是在对数据进行完全备备份时,这个效果更佳的明显。

  在实际应用中,虽然现在不少管理员还是重复数据删除设备与软件自带备份策略同时使用。即用软件自带备份策略将数据备份到重复数据删除设备当中。从而达到节省磁盘空间多目的。这中间多了一个环节,其效果就会打折扣。这主要是因为重复数据删除设备在主存储领域内的使用,还不是主流。笔者相信,随着以后基于重复数据删除技术的主存储产品的成熟,就可以实现直接对存储在重复数据删除设备上的数据进行完全备份,而不用再通过应用软件自带备份功能这个中间环节。在节省磁盘空间的同时,进一步提高数据存储与备份的效率。大家请耐心等待,相信这不久就可以实现。【IT专家网独家撰稿】

作者:胡超明 [b]IT专家网独家撰稿,合作媒体转载时,请注明出处和作者。[/b]

原文链接:http://storage.ctocio.com.cn/sjan/276/9377276.shtml
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: