什么是“重复数据删除”?

lav*_*nio 8 storage-area-network tape deduplication

我的意思是,我可以查字典的定义,但是为什么大家突然谈到虚拟磁带库呢?这里有什么“新的”,以至于它最近出现在新闻中?

ick*_*000 14

重复数据删除是您查看数据集的内容,注意存在的所有重复位,并将数据存储一次,将所有其他数据副本替换为指向该副本的指针的地方。它对备份特别有用,因为当您备份诸如服务器之类的东西时,很多数据是相同的。例如,想象一下,您正在备份 1,000 台 Windows 服务器 - 这些机器上的大部分内容都是相同的。

重复数据删除在今天如此流行有以下三个原因:

  1. 最近,每个人都沉迷于构建利用异地服务器的灾难恢复解决方案。为此,您必须将大量生产数据复制到远程站点,而带宽是一个大问题。您必须复制的数据量的任何减少都有很大帮助。

  2. 公司保留的数据量呈爆炸式增长——这要归功于更便宜的存储和多行业对记录保留的要求。

  3. 该技术最近达到了最佳状态。很长一段时间以来,我们一直在使用重复数据删除(单实例存储等)之类的东西,这有所帮助,但仅在去年左右,我们才看到真正的重复数据删除可以显着减少成为主流的存储量。

  • 我还要补充一点,重复数据删除解决方案的成本正在下降,因此供应商可以更轻松地销售其优势——如果更容易销售,供应商会更多地谈论它……我没有注意到专门针对虚拟磁带的讨论库而不是其他备份方法,但我想这是一个将两者的好处结合在一起的机会。 (2认同)