数据复制技术
数据复制技术即数据镜像技术。与数据存储技术相比,数据复制技术则是通过不断将生产系统的数据复制到另外一个不同的备份系统中,以保证在灾难发生时,生产系统的数据丢失量最少,它是灾备的核心和主流技术。
根据数据复制的层次,数据复制技术的实现可以分成以下几种:
(1)基于存储(磁盘)系统的数据复制:通过存储系统内建的固件(firtnware)或操作系统,利用IP网络或DWDM、光纤信道等传输接口连接,将数据以同步或异步的方式从本地的存储系统复制到远端的存储系统。主要产品包括EMC的SRDF、HDS的TrueCopy、IBM的PPRC等。这种方式优点是独立于主机平台和应用,适合于主机和业务系统很多、较复杂的环境,具有较高的性能和可靠性,其缺点是成本昂贵,而且还要受制于单一的设备厂商,通常必须采用同一厂家的存储平台,甚至是同一系列的存储产品。
(2)基于主机(操作)系统的数据复制:利用生产、灾备中心主机系统通过IP网络建立数据传输通道,通过主机数据管理软件实现数据的远程复制。主要产品包括主机厂商和一些第三方软件公司提供基于主机的数据复制方案,如IBM的XRC软件、BakBone的 NetVault Replicator、Verims的wR软件和最简单易用的国产备份软件中科同向Heartsone Backup等。主要优点是不依赖于底层存储平台,可提供多种不同的方案,基于网络而没有距离限制:主要局限性是需要同种主机平台,占用大量的主机的资源,不太适合多个系统、多种应用的灾备等,效率和管理上也存在一定问题。
(3)基于数据交换层的数据复制:这种方式的复制技术是伴随着SAN的出现引入的,即在SAN的交换层上实现数据复制。实现方式可以通过专有的复制服务器实现,也可以通过存储局域网(SAN)交换机,将数据同步的复制到远端存储系统中。这种方式正在发展之中。
(4)基于数据库的数据复制:利用数据库自身提供的复制模块,通过本地和远程主机间的日志归档与传递来实现两端的数据一致。比如Oracle的Data Guard和SQL Server的Mirror等。优点是不依赖于其它软件和底层存储平台,有较好的兼容性,无需增加额外硬件设备,可支持异构环境的复制等,缺点是对数据库的版本和操作系统平台有特定要求,不能以一种技术实现多种应用的数据复制。另外,因本地应用程序向远端复制的是日志文件,需要远端应用程序重新执行和应用才能生产可用的备份数据。
上述几种技术除了基于数据库的数据复制外,其他技术都具有同步和异步两种复制方式。同步数据复制就是将本地生产系统的数据以完全同步的方式复制到备份系统中。由于发生在生产系统的每一次I/0操作都需要等待远程复制完成才能返回,这种复制方式虽然可能做得数据的零丢失,但是对系统性能有很大的影响。异步数据复制则是将本地生产系统中的数据在后台异步的复制到备份系统中。这种复制方式会有少量的数据丢失,但是对生产系统的性能影响较小。在灾备中心的建设过程中,应根据应用需求和数据复制技术的优缺点选择不同的灾难备份策略。
灾备技术发展趋势
随着信息化的深入发展,存储容量的急剧膨胀。数据和信息的重要性已经远远超越了系统设备的重要性。在当前数据量剧增的情况下,灾备技术也呈现不断发展的态势,取得一些新的进展,体现在以下几方面。
(1)存储虚拟化(Storage Virtualization)技术。该技术是将系统中各种异构的存储设备映射为一个单一的存储资源,对用户完全透明。达到屏蔽存储设备异构和主机异构的目的。通过虚拟化技术。用户可以利用已有的硬件资源,把SAN内部的各种异构的存储资源统一成对用户来说是单一视图的存储池(Storage Pool),而且采用Striping、LUN Masking、Zoning等技术。用户可以根据自己的需求对这个大的存储池进行方便的分割、分配。保护了用户的已有投资,减少了总体拥有成本(TCO)。另外也可以根据业务的需要,实现存储池对服务器的动态而透明的增长与缩减。
通过存储虚拟化技术可实现数据的远程复制,以确保灾备中心与生产中心的数据保持同步以实现数据容灾。存储虚拟化技术可以在不同层面实现,如在智能交换机层面、存储层面或增加第三方设备来实现。采用虚拟存储技术进行数据复制同样也可以有同步复制方案和异步复制方案,需要根据具体的需求选择合适的产品。
(2)重复数据删除技术。该技术通过寻找不同数据块中的冗余数据并删除这些重复的数据来对数据进行压缩。某些重复数据压缩技术甚至实现了20:1的压缩比。通过重复数据删除技术不但能解决单数据中心中多副本占用空间的问题,还可以减少传输备份数据所需要的带宽。重复数据删除技术主要分为基于软件的重复数据删除和基于硬件的重复数据删除两种方式。这种技术已经应用于灾备存储中,如EMC的Avamar、Veritas的NetBackup、中科同向的Heartsone DR等。
(3)持续数据保护(CDP)技术。CDP是一种在不影响主要数据运行的前提下,实现持续捕捉或跟踪目标数据所发生的任何变化,并且能够恢复到此前任意时间点的方法。CDP系统能够提供块级、文件级和应用级的备份,以及恢复目标的无限的任意可变的恢复点。目前该技术尚处于发展阶段,随着技术的不断成熟和完善,将会具有强大的生命力,如中科同向的Heartsone CDP产品