如何备份存储服务器?

And*_*ley 14 raid backup storage network-attached-storage

我正在考虑实施一个非常大的存储服务器,用作其他几台服务器(均基于 Linux)的实时 NAS。

非常大,我的意思是 4TB 和 20TB 之间的可用空间(尽管我们不太可能真正做到 20TB)。

为了数据安全和性能,存储服务器将是 RAID 10,但我们仍然需要一个备份解决方案,包括异地备份。

我的问题是:你如何备份这么多数据!?

这不像我可以只连接一个便携式硬盘驱动器并传输文件。我们目前没有其他设备具有如此大的存储空间。

我是否需要为第二台异地存储服务器做预算,还是有更好的解决方案?

sys*_*138 13

有很多方法可以处理这么大的数据。这在很大程度上取决于您的环境以及您愿意花多少钱。一般来说,有一些整体的“从服务器上获取数据”的策略:

  • 通过以太网就像包装盒上所说的那样,数据流到其他地方进行处理。20TB 复制超过 1GbE 需要很长时间,但可以做到。硬件可以提供帮助(例如 10GbE 链接,或者在某些情况下是 NIC 绑定)。
  • 通过存储子系统如果您使用光纤通道,请将其发送到 FC 网络上的另一台设备。如果您有 SAS,请将其发送到连接 SAS 的设备。一般比以太网快。
  • 将它发送到另一个磁盘阵列将它发送到连接到同一服务器的另一个存储块。

那是100公里的景色。一旦开始放大,事情就会变得更加分散。如前所述,LTO5 是一种专门为此类高密度负载而设计的磁带技术。另一个相同的存储阵列是一个很好的目标,特别是如果您可以使用 GlusterFS 或 DRBD 之类的东西来获取数据。此外,如果您需要备用轮换或仅在阵列发生故障时保持运行的能力将影响您的部署。

一旦您确定了 100 公里查看方法,下一个重要任务将是使用软件。影响这一点的因素首先是您可以在存储服务器上安装的内容(如果是 NetApp,那是一回事,具有大量存储的 Linux 服务器完全是另一回事,具有大量存储的 Windows 服务器也是如此) ,您选择的硬件(例如,并非所有 FOSS 备份包都能很好地处理磁带库),以及您需要什么样的备份保留。

您确实需要弄清楚您想要什么样的灾难恢复。简单的实时复制更容易,但不允许您仅从上周恢复。如果从上周恢复的能力对您来说很重要,那么您需要针对此类事情进行设计。根据法律(在美国和其他地方),某些数据需要保存 7 年以上。

简单的复制是最容易做到的。这就是 DRBD 的设计目的。初始副本完成后,它只会发送更改。这里的复杂因素是网络局部性,如果您的第二个阵列不靠近主要 DRBD 可能不可行。您将需要第二台存储服务器,其存储空间至少与第一台相同。


关于磁带备份...

LTO5 可以保存 1.5TB 的数据,无需压缩。养活这些怪物需要非常快速的网络,即光纤通道或 6Gb SAS。由于您需要一次性备份超过 1.5TB 的数据,因此您需要查看自动加载器(这里是一个示例:link,来自 HP 的 24 插槽 1 驱动器自动加载器)。借助支持它们的软件,它们将在备份过程中为您处理更换磁带。他们很棒。您仍然需要拉出磁带以发送到异地,但这比在备份需要它们时自己整夜闲逛以加载磁带要好得多。

如果磁带给您带来“传统的,ew ”heebiegeebies,虚拟磁带库可能会更适合您的速度(例如来自 Quantum 的这个:链接)。这些伪装成磁带库来备份软件,同时使用强大的(您希望的)重复数据删除技术将内容存储到磁盘。如果您喜欢那种东西,更高级的人甚至会为您将虚拟磁带复制到真实磁带,这对于异地轮换非常方便。


如果您甚至不想使用虚拟磁带,但仍想进行直接到磁盘的备份,您将需要一个足够大的存储阵列来处理 20TB,以及您想要的任何净变化数据把握住。不同的备份包对此的处理方式不同。一些重复数据删除技术非常好,而另一些则是hacky kludges。我个人不知道这方面的 FOSS 备份软件包的状态(我听说过 Bacula),但它们可能已经足够了。很多商业备份包都有安装在要备份的服务器上的本地代理,以增加吞吐量,这有很多优点。


Mad*_*ter 9

LTO-5 自动点唱机?您需要 3 到 15 个磁带来支持该阵列,这不是一个非常大的数字。自动点唱机会为您更换磁带,而好的备份软件(例如 bacula)会跟踪哪些文件在哪个磁带上。

您还需要考虑备份如此大的文件系统所需的时间,因为在此期间 FS 很可能会发生变化。为获得最佳结果,支持快照的文件系统将非常有用,因此您可以拍摄即时快照并针对该快照执行完整或增量备份,而不是针对实时文件系统。

  • 现代磁带备份系统是高度自动化和机器人化的:) (4认同)
  • 是的,磁带备份通常允许增量备份。一个好的备份策略是每月或每两年进行一次完整备份(长、慢、大量磁带),并在中间进行每日增量或差异备份。 (3认同)

Bre*_*nt 5

您可能应该考虑备份到磁盘,因为磁带需要很长时间,并且顺序访问,恢复需要永远。

绝对利用差异增量备份 - 仅备份更改,无论频率对您来说都有意义。

可能理想的解决方案是在另一个位置第二个类似大小的服务器,定期发送增量备份,如果主服务器死机,可以快速交换到位。然而,另一种选择是在现场使用可移动驱动器,然后将其带到异地进行存储。

当您处理这么多数据时,将您的备份分解为较小的备份作业也是有意义的,如果不能每天都备份它们,请错开备份,以便有一天备份 A 组,并且设置 B 下一个。

始终考虑恢复过程。当我们不得不从数百个演出备份作业中恢复文件时,我们被刺痛了一次,这需要大量内存和大量时间来重新构建备份索引和恢复。最终,我们无法在一天内完成它,不得不构建一个专用的恢复服务器,让我们的主备份服务器继续它的夜间工作!

- 添加 -

您还想考虑重复数据删除技术,它可以通过不为多个用户多次备份相同信息来节省大量空间。许多备份解决方案或文件系统将重复数据删除作为其功能的一部分。

  • 我想投票,但我没有看到提到的磁带。如果需要任何重要的保留窗口与异地存储相结合,磁带很可能将成为该数量数据备份机制的重要组成部分。与可移动硬盘驱动器相比,用于长期异地存储的 LTO-5 盒式磁带的成本使其非常有吸引力。盒式磁带也设计用于档案存储,而可移动硬盘驱动器通常不是。 (2认同)