平均无故障时间 (MTTF):当磁盘制造商发布此信息时,您应该如何解释他们的数字?

Kai*_*die 10 hard-drive statistics hardware-failure hard-drive-failure

平均无故障时间 (MTTF) 通常以小时为单位给出,通过进行一些计算,似乎磁盘应该在经过很多年之后才会发生故障。

似乎磁盘需要更频繁地修复。有谁知道为什么会这样?

我认为这个指标有些可疑。在这里解释错误吗?

ste*_*nvh 14

首先:

MTTF = 平均无故障
时间 MTTR = 平均修复时间
MTBF = 平均故障间隔时间 = MTTF + MTTR

MTBF 通常或多或少等于 MTTF,因为修复可能需要一个小时,而 MTTF 可能是数万小时。但 MTBF 通常也不适用,因为有缺陷的产品不会得到维修,而只是更换,因为维修成本高于更换。

MTTF 计算是一种复杂的统计方法,涉及计算每个单独部件失败的几率。这不是人们有时认为的线性的事情。如果您的 MTTF 为 1000 000 小时,这并不意味着 1000 台设备将在 1000 小时后出现故障,或者您将在 1 小时后在 1000 000 台设备中出现故障。
许多电子设备遵循“浴缸曲线”

在此处输入图片说明

早期有很多故障,然后很长一段时间内几乎没有任何故障,并且在接近生命周期结束时,故障数量再次上升。硬盘中也有一些机械部件的故障曲线比较线性;这从第 1 天开始缓慢上升。

例如,如果制造商说 1000 000 小时 MTTF(最常见的是 POH,或通电时间),则意味着驱动器平均应持续使用 100 年以上。有些驱动器会持续更长时间,有些会更早出现故障。因此,尽管有 1000 000 小时,但在 1000 小时后完全有可能发生故障。我曾经有一个驱动器在一周内出现故障,然后你必须回想浴缸曲线。替换驱动器已经愉快地旋转了 > 50k 小时。

  • 一些值得注意的事情可能是早期故障通常被称为老化。早期故障率低得多的制造商通常会在设备老化阶段运行设备。此外,纯电子产品不会出现磨损期,只会出现老化。 (3认同)
  • MTTF 主要用于指示您应该从设备或小部件中获得什么样的生活。由于显而易见的原因,它不能准确预测设备的故障日期。这只是基于对可用数据的统计分析的估计,应仅被视为如此。对预算(我应该在这里摊销或折旧成本多长时间)和计划(在我们必须得到下一个小部件之前我们可以期望小部件执行多长时间)很有用。 (2认同)
  • @Kaitlyn - 我猜你指的是坏扇区。我会说磁盘故障是当您无法再读取或写入驱动器时。通常是机械错误,例如头部碰撞。这通常发生在您仍然有很多好的扇区时。 (2认同)

sup*_*cat 5

如果一台设备的 MTBF 为 1,000,000 小时,这并不意味着任何设备都可以持续 1,000,000 小时。相反,它粗略地表示,如果 1,000,000 台在额定使用寿命内的设备各运行一小时,或者 100,000 台设备运行 10 小时(但仍在额定使用寿命内),或者 60,000,000 台设备运行一分钟,等等。该批次中大约会有 1 处不合格。请注意,额定使用寿命与 MTBF 完全正交。考虑以下两种类型的小部件:

  1. 每个小部件,无论年龄大小,每小时都有 0.1% 的几率出现​​故障。
  2. 每 10 亿个小部件中,除了一个之外,所有小部件都会运行 61 分钟,然后就死掉;30分钟后那个人就会死;这些小部件的指定使用寿命为 60 分钟。

第一种类型的小部件的平均寿命约为 1,000 小时,MTBF 约为 1,000 小时。第二个的平均寿命为 61 分钟,但其使用寿命内的 MTBF 为 1,000,000,000 小时。虽然说第二个器件的 MTBF 几乎是预期寿命的十亿倍似乎很奇怪,但 MTBF 并不是一个毫无意义的数字。

假设要进行一项实验,要求 1,000,000 台设备全部正常工作一小时,然后全部报废。如果任何一个设备出现故障,整个实验就会毁掉。哪个更有用——一个设备平均可以持续 1,000 小时,但 MTBF 仅为 1,000 小时,或者一个设备最多可以持续 61 分钟,但失败的可能性只有十亿分之一。符合那个标记吗?