您的位置:首页 > 其它

【备份专题】备份软件关键特性详细介绍

2016-09-11 12:21 423 查看


备份软件关键特性详细介绍

ICT架构师技术交流





前期文章介绍了备份软件的系统架构和组网方式,今天我们重点讨论下关键特性,数据重删压缩是备份软件的基本特性。为了达到真正备份数据的目的,数据副本一般需要通过广域网备份到异地备份中心,数据重删压缩就可有效节约网络带宽、减低客户带宽租用成本,另外通过重删压缩还可以节约备份介质存储空间,降低客户备份投资。



备份方案的重删压缩类型非常丰富,一般分为源端重删、目标端重删和介质重删。

源端重删由备份软件提供,在服务器备份客户端完成重删,可以有效节约网络传输带宽,但对业务有所影响。

目标端重删也是由备份软件提供,在介质服务器上完成数据重删,目标端重删的优势是可以让每个客户端共享重删数据指纹,实现全局重删。

介质重删一般有备份介质提供,常见的有VTL和存储系统(自带重删压缩功能),物理带库的线性读写模式限制它只能实现压缩,当备份软件发现物理带库或VTL备份介质时,也会关闭重删压缩功能。介质重删根据数据在备份介质中重删压缩的时机不同,还分为Inline和Postline重删压缩,当然,Inline会更加节省存储空间。

数据重删首先以固定块为单位进行计算Hash值,把计算出Hash值跟重删Hash数据库进行比对,如果Hash已经存在,那对应数据块就不再进行存储,只是用索引或指针来记录该数据块;如果Hash不存在,说明该数据块是新数据,需要进行物理存储,再用索引记录,相同的数据块物理上只存储一次。通过索引指针,可以看到完整的数据逻辑视图,而实际上物理存储的数据却很少。



今天我们通过SimPana和AnyBackup备份软件,来分析下备份软件的重删压缩、复制等功能,希望对大家了解备份软件重删压缩有所帮助。

SimPana重删压缩原理

SimPana是采用两级重删指纹数据库架构(SSDB和DDB),支持源端重删和目标端重删同时开启,但是考虑到性能影响,一般建议只开启其中一种。备份任务开始时,如果客户端配置了源端重删,备份客户端将首先会把备份数据进行压缩,然后按照重删SHA 512 Hash算法,切成固定大小计算Hash值。

如果该Hash值在本地服务器源端重删数据库(SSDB)没有记录,说明该数据是新数据,则需要通过网络把Hash值传输给MA介质服务器,在MA的DDB中查找并把比对结果返回本地服务器客户端,有记录说明是重复数据不需要备份数据块,没有记录则需要发送数据块和Hash索引到MA介质服务器,备份该数据块到备份介质,并更新本地服务器SSDB和MA的DDB数据库记录。

如果该Hash值在本地服务器源端重删数据库(SSDB)有记录,说明该数据块是重复数据,只需记录数据索引不需要备份数据到备份介质中。



全局重删主要依赖于两级重删指纹数据库架构(SSDB和DDB),SSDB在客户端本地保留一个数据库,并把Hash值同步到MA介质服务器DDB数据库,所以每个客户端通过共享DDB实现全局数据重删。使得几百个客户端的重复数据,可跨越不同的存储系统、不同的存储策略,最大限度地消除多个数据中心的重复数据。

介质服务器并行重删

因为单个MA的性能和支持的重删压缩空间是有限的,为满足大规模去重需求,把一组MA介质服务器及存储介质组成一个集合(MA介质服务器间共享DDB,且MA集群之间要同步索引和DDB指纹数据),组成并行重删域,以获得最佳性能。



随着并行重删网格中MA节点的增加,可线性提升重删容量、吞吐率和并发性能,同时内置自动故障切换能力,网格中即使有一个MA节点不可用,剩余的MA节点可以继续工作接管备份。并行重删网格中MA节点可实现自动负载均衡。

数据复制功能

数据恢复操作与常规恢复完全一样,通过Hash索引指针建立逻辑视图恢复,恢复过程不需要重组重复数据删除数据,也不需要使用重复数据删除数据库,所以恢复速度比较快。

SimPana还支持备份数据的远程复制容灾,通过MA之间复制,可以实现对非重删数据副本和重删数据副本的容灾。非重删数据副本复制称为Auxiliary

Copy,重删数据副本复制成为Dash Copy,相比之下Dash Copy应该更广泛。下面我们重点看看Dash Copy技术。



在备份管理服务器的控制下,在源端MA上的复制数据副本任务,首先读出需要复制数据的Hash值并传输到目标MA端,在目标端的DDB中对Hash值进行比对,只有新数据块才传输真实数据块到目标MA端复制到介质服务器,否则,在目标MA上只记录数据索引即可。并且通过介质跟踪(Vault Tracker)功能可以实现从源端恢复数据。

硬件快照IntelliSnap

硬件快照是实现Server Free备份的基础,也是基于备份软件实现存储应用联动的一个特性,目前很多存储厂商都已近和备份软件厂商合作,实现硬件快照,实现对DB2, MySQL, Oracle, SQL Server, SAP关键应用基本无影响的备份。



部署该方案,首先要在业务服务器上安装iDA,识别业务应用、生产存储LUN和卷设备,通过命令对业务打快照、刷数据,最终在介质服务器MA上能对快照建立索引、挂载快照进行备份。通过结合备份策略实现本地去重备份、通过介质服务器MA间复制实现异地容灾和长期保存。

AnyBackup重删原理

AnyBackup其产品架构也是采用备份管理服务器和介质服务器架构,但是要求备份服务器和介质服务器部署在一起,暂不支持独立部署。除了支持主流应用和操作系统外,还支持国内操作系统和应用如,中标麒麟、RedFlag红旗、Gbase(南大通用)数据库、武汉达梦数据库等。



AnyBackup的重删技术和Simpana类似,也是在客户端首先进行数据切块,根据Hash算法计算指纹在客户端本地进行比对,如果没有找到记录,数据将在客户端会在进行二次切片,再到备份服务器端查询指纹记录(Hash指纹请求通过网络传输到备份服务器端),如果记录存在说明数据是冗余数据,则不会备份数据到备份介质。

否则,备份数据和指纹将一起传输到备份服务器端备份到存储介质,并更新客户端和备份服务器端是重删指纹数据库。AnyBackup采用二次切片和变长数据块切片重删技术,可以提供重删率。

AnyBackup远程复制技术

由于AnyBackup当前不支持介质服务器单独部署(应该有规划分离部署),目前只能一个介质服务器是一个备份域,所以目前只支持备份域间复制。在一个介质服务器内,支持全局重删(备份管理和介质服务器一起部署)。

AnyBackup虚拟机即时恢复

即时恢复是虚拟机备份的一个亮点,他其实类似于虚拟机的容灾功能,当生产系统发生故障后,虚拟机可以通过配置文件直接在备份介质上拉起,无需把虚拟机文件从存储介质恢复到生产存储(Simpana采用私有备份数据格式,备份数据一般需要恢复才能拉起业务),明显降低业务切换和拉起时间。



首先对VM进行快照,通过过AnyBackup将快照文件备份到存储介质中,当生产存储、VM故障或需要恢复时,备份服务器通过解析虚拟机磁盘文件,把备份VM文件数据以NFS形式映射给ESXi直接拉起业务。这种即时恢复虚拟机的方式,目前Veeam、eBackup、AceSure等备份软件也支持,在虚拟机备份场景下具有很大优势。

温馨提示:

请搜索“ICT_Architect”“扫一扫”下面二维码关注公众号,获取更多精彩内容。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: