更换硬盘

Gar*_*nzo 19 hardware hard-drive lifecycle

我想知道在(相当)系统关键型数据库服务器使用一定年数之后,在它死之前更换硬盘驱动器是否是个好主意。

例如,我想在使用 3 年后更换硬盘。由于我有许多跨服务器的硬盘驱动器,我可以错开更换哪些硬盘驱动器。

这是一个好主意,还是人们只是等待失败?

jef*_*aid 33

Google 对磁盘驱动器进行了研究,发现磁盘寿命与故障之间几乎没有相关性。SMART 测试也不显示失败。

我的本地观察(> 500 个服务器)是相似的。我的新磁盘很快出现故障,而旧磁盘仍在继续运行。

我的一般规则是,如果我们发现磁盘问题(SMART 或系统错误),我们会立即更换它。如果没有,则驱动器会在服务器运行时循环退出。

谷歌研究 http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en/us/archive/disk_failures.pdf

  • 我同意。我们发现,与运行 3.5 英寸 9GB SCSI 驱动器的 10 年旧服务器相比,使用较新的 2.5 英寸 SAS 驱动器的故障率要高得多! (2认同)

Sky*_*awk 13

不。

更换活动生产服务器上的硬盘驱动器的最大问题之一是,这样做会触发重建。尤其是在使用 RAID5 时,尤其是在使用大型驱动器时,强制重建会产生不可恢复故障的巨大风险。在重建过程中丢失阵列的风险远远大于将使用了 3 年的驱动器留在原地的风险。

举一个极端的例子,如果您连续更换由 2TB 磁盘组成的 6 磁盘 RAID5 阵列中的每个磁盘,那么在其中一次重建期间发生不可恢复读取错误的理论风险约为 58%(根据我的餐巾纸数学计算;请自己做并比较笔记)。换句话说:您的“预防性”磁盘更换实际上就是一种破坏行为。

我会考虑在旧服务器中刷新驱动器的唯一时间是在“翻新”它的过程中,例如,在从一项任务中退役之后,在将其重新投入使用并担任新角色之前。即使在那个时候,容量和性能要求也远比驱动器的寿命重要。