SSD 驱动器是否与机械驱动器一样可靠 (2013)?

hoo*_*enz 162 hardware storage ssd sata sas

SSD 驱动器已经存在好几年了。但可靠性问题仍然存在。

我想这是 4 年前发布的这个问题的后续,最后一次更新是在 2011 年。现在是 2013 年,有很大变化吗?我想我正在寻找一些真实的证据,而不仅仅是直觉。也许您正在 DC 中使用它们。你有什么经历?

固态硬盘的可靠性


更新:

现在是 2016 年。我认为答案可能是肯定的(可惜它们每 GB 的成本仍然更高)。

这份报告提供了一些证据:

生产中的闪存可靠性:预期和意外

以及一些关于(消费者)机械驱动器的有趣数据:

Backblaze:硬盘数据和统计

eww*_*ite 175

这将取决于您的工作负载和您购买的驱动器类别...

在我的服务器部署中,我没有遇到正确规范的 SSD 故障。这涉及许多不同类型的驱动器、应用程序和工作负载。

请记住,并非所有 SSD 都是一样的!!

那么“正确规范”是什么意思?

如果您的问题是关于 SSD 在企业和服务器应用程序中的使用,那么自最初的问题以来,过去几年发生了相当大的变化。这里有几件事情需要考虑:

  • 确定您的用例:有消费类驱动器、企业驱动器,甚至坚固耐用的工业应用 SSD。不要购买供桌面使用的廉价磁盘并在其上运行写入密集型数据库。

  • 有多种外形尺寸可供选择:当今的 SSD 可以在 PCIe 卡、SATA 和 SAS 1.8"、2.5"、3.5" 和其他变体中找到。

  • 为您的服务器使用 RAID:在服务器情况下,您不会依赖单个机械驱动器。为什么要对 SSD 做同样的事情?

  • 驱动器构成:有基于 DRAM 的 SSD,以及 MLC、eMLC 和 SLC 闪存类型。后者的使用寿命有限,但制造商对其进行了明确定义。例如,您会看到3 年的每日写入限制,例如5TB/天

  • 驱动器应用很重要:一些驱动器是通用的,而其他驱动器是读优化或写优化的。sTec ZeusRAMDDRDrive等基于 DRAM 的驱动器不会磨损。这些是高写入环境和前端较慢磁盘的理想选择。MLC 驱动器往往更大,并针对读取进行了优化。SLC 驱动器的使用寿命比 MLC 驱动器长,但企业级 MLC 似乎确实适用于大多数情况。

  • TRIM似乎并不重要:硬件 RAID 控制器似乎仍然不完全支持它。大多数时候我使用 SSD,它会在硬件 RAID 设置上。这不是我在安装中担心的事情。也许我应该?

  • 耐用性:过度配置在服务器级 SSD 中很常见。有时这可以在固件级别完成,或者只是通过以正确的方式对驱动器进行分区。磨损均衡算法也更好。一些驱动器甚至报告寿命和耐用性统计数据。例如,我的一些 HP 品牌的 Sandisk 企业 SSD98% life remaining在使用两年后显示。

  • 价格大幅下降: SSD 在许多应用中达到了正确的性价比。当真正需要性能时,现在很少会默认使用机械驱动器。

  • 声誉已得到巩固: 例如,英特尔是安全的,但不是高性能的。OCZ不可靠。基于Sandforce的驱动器很好。sTec/STEC非常可靠,是许多高端阵列驱动器的 OEM。Sandisk /Pliant 类似。OWC拥有出色的 SSD 解决方案,并为低影响服务器和工作站/笔记本电脑部署提供卓越的保修服务。

  • 断电保护很重要:查看带有超级电容器/超级电容器的驱动器,以在电源事件期间处理未完成的写入。一些驱动器通过板载缓存提高性能或利用它们来减少磨损。Supercaps 确保这些写入被刷新到稳定的存储。

  • 混合解决方案:硬件 RAID 控制器供应商提供使用 SSD 扩充标准磁盘阵列以加速读/写或用作智能缓存的能力。LSI 拥有CacheCade及其Nytro 硬件/软件产品。还存在软件和操作系统级解决方案,用于在应用程序、数据库或管理程序系统上提供本地缓存。ZFS等高级文件系统非常智能地使用了读写优化的 SSD;ZFS 可以配置为使用单独的设备进行二级缓存和意图日志,并且 SSD 经常用于该容量,甚至用于 HDD 池。

  • 顶级闪存已经到来:FusionIO这样的PCIe 闪存解决方案已经成熟到组织可以轻松部署依赖提高性能的关键应用程序的地步。RanSanViolin Memory等设备和 SAN 解决方案仍然存在,并且有更多的进入者进入该领域。

在此处输入图片说明

  • TRIM 在几乎没有过度配置的驱动器中非常重要,这在 $/GB 非常重要的消费驱动器中非常重要。大多数企业驱动器都有足够的过度配置,TRIM 没有任何区别。 (13认同)
  • @rickyduck,实际上在数据中心,单个驱动器故障受 RAID 保护,这意味着花费几美元来更换它而不会停机;而在游戏设备中,单个驱动器的故障会导致数据完全丢失,并且需要重新安装操作系统。 (5认同)
  • @MisterSmith 看看我上面写的。不同的SSD有不同的特性。为工作使用正确的工具。如果我使用 [Corsair](http://www.corsair.com/en/ssd.html) 或其他消费级驱动器并将其用作主动写入密集型数据库系统的 SSD 或 [ **ZIL** 日志设备](http://nex7.blogspot.com/2013/04/zfs-intent-log.html) 对于 ZFS 存储阵列,我会在一两个月内完成它。 (2认同)
  • @MisterSmith 即使是高端台式机 SSD,每 GB 也比针对典型数据中心用途的那些更便宜。除了在某些情况下更强大的控制器(或者只是针对吞吐量而不是突发性能进行调整的低容量固件)之外,它们还可以在生产运行的顶部获得最佳闪存,因为许多服务器工作负载的 IO 密集程度比台式机高几个数量级驱动器,并会迅速杀死消费者驱动器。 (2认同)

Chr*_*s S 59

自 2009 年以来,我工作中的每台笔记本电脑都有 SSD 或 Hybrid。总结一下我的 SSD 体验:

  • 我称之为“第一代”驱动器,主要在 2009 年左右销售:
    • 第一年大约有 1/4 人死了,几乎都是死于猝死综合症(SSD - 很有趣,笑)。这对最终用户来说非常明显,也很烦人,但巨大的速度差异使得这种持续的故障模式可以容忍。
    • 3 年后,所有驱动器都死了(突然死亡或磨损),除了两个仍在踢(实际上现在服务器中的 L2Arc 驱动器)。
  • “第二代”硬盘在 2010-11 年左右销售,与上一代不同,因为它们的猝死率急剧下降。然而,磨损的“问题”仍在继续。
    • 第一年之后,大多数驱动器仍然可以工作。有几个突然死亡。一对夫妇因磨损而失败。
    • 2-3 年后,有一半以上的人仍在工作。第一年的失败率基本上仍在继续。
  • 2012 年以上销售的“第三代”驱动器都仍在工作。
    • 第一年之后,一切都还在工作(敲木头)。
    • 我得到的最老的驱动器是 2012 年 3 月的,所以还没有 2-3 年的数据。

SSD 故障(累积)


2014 年 5 月更新:
此后一些“第二代”驱动器出现故障,但大约三分之一的原始驱动器仍在工作。上图中的所有“第三代”驱动器仍在工作(敲木头)。我从其他人那里听过类似的故事,但他们仍然带着同样的警告,即迅捷的翅膀上的死亡。警惕者将妥善备份他们的数据。

  • 再给第三代一两年。;) (22认同)
  • 同样值得注意的是,SSD 比 HDD 更容易出现固件错误;固件既复杂又不成熟,这不是一个很好的组合。 (7认同)
  • 我的经验与此相呼应。也就是说,我们仍然为员工提供 USB 硬盘驱动器以用作时间机器备份(除了我们的标准异地备份方案),以便在发生灾难性故障或丢失时进行快速、精细的恢复。 (2认同)
  • @安迪是对的。从 2009 年开始,你说半衰期大约是一年。对于 2010 年到 2011 年,我们现在刚好处于该范围中间的 3 岁,您表示半衰期为 3 年。这只能基于目前的观察。至少要到 2016 年才能真正知道 2012 年和 2013 年驱动器的半衰期是否超过 3 年。(我们可以尝试从早期故障中推断出来,但这些很可能只是孤立的制造缺陷,而不是由长期- 定期使用。) (2认同)

小智 18

根据我的经验,真正的问题是控制器的老化,而不是闪存本身。我已经安装了大约 10 个三星 SSD(830、840 [not pro]),到目前为止它们都没有出现任何问题。完全相反的是带有 Sandforce 控制器的驱动器,我在使用 OCZ 敏捷驱动器时遇到了几个问题,特别是在不规则的时间间隔内冻结,驱动器停止工作,直到我关闭/打开计算机。我可以给你两个建议:

  1. 如果您需要高可靠性,请选择带有 MLC 的驱动器,更好的 SLC 闪存。三星 840 fe 有 TLC 闪存,保修期很短,我认为不是没有任何理由;)

  2. 选择带有已知稳定控制器的驱动器。


Sac*_*a K 11

www.hardware.fr是法国最大的硬件新闻网站之一,是法国最大的在线经销商之一www.ldlc.com 的合作伙伴。他们可以访问他们的退货统计数据,并且自 2009 年以来每年发布两次故障率报告(母板、电源、RAM、显卡、HDD、SSD...)。

这些是“早死”统计数据,使用 6 个月到 1 年。直接返回制造商的退货也不算在内,但大多数人在第一年就返回经销商处,这应该不会影响品牌和型号之间的比较。

一般来说,硬盘故障率在品牌和型号之间差异较小。规则是更大的容量 > 更多的盘片 > 更高的故障率,但没有什么戏剧性的。

SSD 故障率总体较低,但某些 SSD 型号确实很糟糕,在您要求的期间(2013 年),臭名昭著的型号的回报率约为 50%。现在似乎已经停止了那个臭名昭著的品牌被收购了。

一些 SSD 品牌正在“优化”他们的固件,只是为了在基准测试中获得更高的结果,而您有时最终会出现死机、蓝屏等问题……现在这似乎不像 2013 年那么严重。

故障率报告在这里:
2010
2011 (1)
2011 (2)
2012 (1)
2012 (2)
2013 (1)
2013 (2)
2014 (1)
2014 (2)
2015 (1)
2015 (2)
2016 (1) )
2016 (2)