如何为 124 TB Isilon 文件系统获得廉价的灾难恢复?

Veb*_*osa 5 backup disaster-recovery storage

在我们的 Isilon 集群上,我们有一个 124 TB 的文件系统。它目前已满 38%,有 3100 万个文件。大约一半的数据是图像文件,平均文件大小为 1.5 MB。我们使用快照来防止意外删除,但我们需要一些不同的东西来防止完全故障(例如,系统管理员错误、软件错误或水、热或火灾损坏)。而且因为我们是一个糟糕的研究实验室,所以它不应该太贵。

我们目前尝试备份到磁带,但这有两个问题。首先,仅仅遍历目录树并说明每个文件需要超过五天的时间,因此即使是增量备份也需要一个多星期。其次,也是最重要的一点,恢复需要数周甚至数月的时间。

理想情况下,我们希望在灾难发生后的一周内再次访问大部分数据。(如果我们可以选择首先恢复哪些目录,那么在几周内逐渐恢复数据是可以的,但是采购新的存储设备并恢复可能需要比这更长的时间。)我能想到的唯一方法一周是在单独位置的磁盘上维护一个副本。丢失至少几天的工作是可以的,因此复制可能会延迟一点或在几天内覆盖文件系统。复制品的性能比原始品差很多也是可以的。

Isilon 解决方案是使用 SyncIQ 将文件系统复制到另一个群集。因为这是在块级操作,所以避免了遍历文件系统和统计每个文件的问题。正如预期的那样,成本有点高:SyncIQ 软件的许可证是 55,000 美元,然后还有昂贵的 Isilon 存储的同步成本(尽管使用它们更便宜的 NL 存储有点帮助)。我预计 Isilon 解决方案的价格将在每 TB 500 到 1000 美元之间,这远好于我们为主存储支付的 1300-1900 美元/TB,但对我们来说仍然是很多钱。

鉴于现在原始硬盘驱动器的价格为 60 美元/TB,我希望 124 TB 的慢速存储能够以远低于 Isilon 的价格拼凑在一起,并且有一种方法可以在不到一周的时间内复制更改。你能想办法吗?

小智 1

我在一家也运行 Isilon 集群的商店工作;我还没有真正接触过它太多,所以我不能对任何具体细节说太多。

但按照我们的设置方式,我们确实备份到磁带;我们有一个磁带机器人,因此我们不必一直处理更换盒带的问题(我认为这使得长时间备份更容易忍受。)我们还选择了更昂贵的 X 系列 Isilon 节点,并且刚刚获得了一堆; 是的,每个节点的存储更少,但也允许更多的故障容忍度。