假设我正在设置单机服务器。在不知道其中的特定组件(并且能够查找其 MTBF)的情况下,服务器中硬件组件的典型相对故障率是多少?
同样,企业使用的所有服务器中最常更换组件的排名是什么?
关于硬盘,很多人对MTBF有误解,认为MTBF为10万小时的硬盘平均可以使用11.5年。制造商的意思是,在大量驱动器的集合中,N,在它们的生命周期内,一个驱动器将每 100,000/N 小时归档一次。如果您有 100,000 个驱动器,每个驱动器的 MTBF 为 100,000 小时,那么您应该期望驱动器平均每小时发生故障。
硬盘驱动器出现故障的频率比人们预期的要高。备份,备份,备份。
任何带有活动部件的东西都可能发生故障,包括磁带驱动器、软盘驱动器、风扇等。我已经让显卡上的风扇死了,导致显卡死机。我的电源风扇坏了,导致计算机的大部分部件都坏了。(从那时起,我就再也没有构建过没有额外风扇的系统。)磁带驱动器需要格外小心,否则它们的使用寿命将显着缩短。这是因为它不仅会移动,而且磁带头还会与磁带介质进行物理接触——至少在多种磁带驱动器中是这样。使用普通磁带清洁介质过于频繁地清洁驱动器会磨损磁头。
我的内置芯片组风扇死了,但到目前为止没有任何影响。到目前为止,我从未遇到过 CPU 风扇死机,但我倾向于经常升级,因此我可能会通过升级来避免这种情况。(咧嘴笑)
我每隔几年更换一次磁盘驱动器(主要是因为可用容量增加得如此之快),因此遇到的硬盘驱动器故障相对较少。我遇到过很多电源故障——对于一个除了风扇之外没有其他移动部件的组件,我天真地预期的要多得多。我认为电源不规则是许多电源故障的原因。
到目前为止,在几十年的计算中,我从未遇到过 CPU、RAM 或主板故障,除非有合理的原因,例如过热(风扇死机)。然而,多年来,一些品牌的主板的使用寿命比预期的要短得多,原因是部件低于标准,通常在电源进入主板的地方制造错误的电容器。
任何有插入式连接的地方都是故障点。由于廉价的镀锡连接器,我的计算机出现故障(大多是很久以前)。锡被氧化,随着时间的推移,连接越来越不可靠。最终我拔掉了所有东西,用橡皮擦去锡连接器去除氧化,重新插入所有东西,然后继续运行一段时间。金色连接器是首选连接器是有原因的。
从我在公司环境中看到的情况来看,我的家经历了混合,组件似乎按这个顺序失败,从最频繁到最不频繁。
上面没有提到,但是您应该期望所有闪存棒/卡最终都会消失,具体取决于使用频率。但考虑到大多数此类卡的平均使用情况,这将需要很长时间。闪存会随着使用而“磨损”,并且存储单元最终会失效。
有趣的是,电池。
我没有确凿的数据,但我一生中更换过的故障或性能不佳的电池比任何其他组件都多。这包括不间断电源、笔记本电脑、控制器电池、手机电池以及可能的许多其他电池。
这导致我总是为服务器机房的 UPS 储备一个额外的电池组。
| 归档时间: |
|
| 查看次数: |
10291 次 |
| 最近记录: |