SAS 磁盘与入门级 SSD

iBB*_*BBi 14 storage

我们正在采购新的联想 SR650 服务器(将托管多个 Oracle DB 服务器、SAP)& 供应商提出以下存储选项

  • ThinkSystem 2.5" 1.2TB 10K SAS 12Gb 热插拔 512n 硬盘(数量:16 个磁盘)
  • ThinkSystem 2.5" 5210 960GB 入门级 SATA 6Gb 热插拔 QLC SSD(数量:16 个磁盘)
  • ThinkSystem 2.5" 5210 1.92TB 入门级 SATA 6Gb 热插拔 QLC SSD(数量:16 个磁盘)

我们在某处读到,在突然断电时,与 SAS 磁盘相比,数据完全损坏的可能性更大。

从性能和可靠性的角度来看,什么是更合适的存储选项?

我们有冗余的 UPS 以及数据中心专用的在线生成器。最初我们将托管 2 个 SAP 服务器(生产和开发)。两者都是虚拟化的。每个 VM 空间使用量约为 3 TB。过去我们使用Raid 5的经验并不好,我们所有的服务器都使用RAID 10,而在RAID10之后,我们没有遇到过去几年的任何故障。

将 16 个磁盘分成两个 Raid 10 阵列是个好主意吗?第一个阵列上的 PRD 和第二个阵列上的 DEV,所以无论进行什么操作(数据复制、备份等),都不应该影响第二个阵列?

sho*_*hok 28

QLC SSD 绝对不足以像数据库和 SAP 那样写入繁重的工作负载。强烈建议购买企业级TLC盘,如三星PM/SM863和英特尔S4510/S4610。

我不会走 SAS 10k 路线,除非 SSD 系统的成本超出您的预算。

最后,我会将所有磁盘保留在同一个 RAID10 阵列中,以便生产工作负载可以从所有 16 个磁盘的 IOPS 中受益。

  • @MSalters 不仅是耐力问题,而且主要是 IOP 问题。当前的消费级 SSD 提供非常低的同步写入(读取:`fsync()`)性能,导致在面临 fsync-rich 工作负载(作为写入密集型 SQL 数据库)时低于预期的结果。此外,在这种情况下,写入放大会猛增,导致 SSD 寿命缩短。 (6认同)
  • 他们是。入门级光盘通常每天有 40-60GB 的写入预算。对于操作系统等来说足够了。 PM863 的额定值更多。我看到 1.92tb 版本是为 2800tb 写入而设计的。不一定非常重 - 但绝对更好。 (2认同)

Bar*_*958 9

当然,如果可以,请始终使用闪光灯。QLC 具有一些疯狂的低耐力,因此请注意备用单元的使用情况,并准备在它们疯狂死亡时更换驱动器 - 保留一些库存,也许可以主动进行。你会没事的 :)


Joe*_*oel 8

在原始速度方面,问题中的 SSD 选项将大大优于 SAS 驱动器。很尴尬,真的。不过,不要使用 QLC 磁盘!可以使用消费级 SSD,但要使用 TLC 或更好的方式寻找磁盘。*

此外,您需要小心使用消费级 SSD 来构建 RAID 卷。现代 SSD 具有欺骗操作系统和 RAID 控制器的内部控制器,并且在实际情况并非如此时会声称已完全提交数据!在打算安装这些驱动器的台式机系统中这样做是有充分理由的,但是如果发生电源故障,它可能会导致服务器 RAID/SAN 卷中的大量数据丢失,因为操作系统认为已提交的数据是仍然在磁盘内的易失性缓存中,突然整个条带的检查位关闭。

企业级固态硬盘通过一个小型内部电容器避免了这个问题,如果电源下降,它能够提供足够的电力来完成仍在易失性缓冲区中的任何事情。这是一个 2 美元的制造附加费,但它可以使驱动器的价格增加三倍(或更多):(

您也可以通过确保您有一个带有自己的电池单元的 RAID 控制器来解决这个问题,或者如果您对数据中心和备份的电源情况非常有信心

考虑到这一点,我看到了这一点:

我们有冗余 UPS,以及数据中心专用的在线发电机。

那是一个开始。最重要的是,我希望看到该数据中心的历史记录,证明 UPS 电池按计划更换,发电机实际上每季度维护和通电一次,并且数据中心在没有意外的情况下经受住了之前的电力问题服务器掉线。如果您拥有或可以获得此文档,那么在服务器中使用(非 QLC)消费者 SSD 应该会很舒服。


* 注意:QLC 最终有可能超过 TLC 的耐用性,但这不是今天市场上的产品。因此,这篇文章可能不会过时,未来的读者应该做更多的研究。

  • 任何来自受人尊敬的供应商的消费者 SSD 都会正确地遵守同步/刷新/FUA。这意味着重要的写入(即:同步的)一旦报告为完成,将真正存储在安全存储中**如果**RAID卡正确传递同步/刷新请求。使用 AHCI 或 IT 控制器时,这不是问题;然而,一些硬件 RAID 控制器依赖于它自己的断电保护写回缓存,不会*传递同步/刷新。在这些情况下,私有 SSD DRAM 缓存*必须被禁用*,从而导致性能低得多。 (4认同)
  • @MSalters 这假设 RAID 控制器将所需的同步/屏障传递给 SSD(否则,它无法“确定”SSD 是否完成了所需的写入)。*有些*控制器*似乎*这样做,但其他控制器只是丢弃任何同步/屏障信息。最后,硬件 RAID 控制器是记录不足的黑匣子,人们必须相信它会做正确的事情。出于这个原因,我非常喜欢开源 RAID,尤其是基于 ZFS 的。请查看 [此处](https://serverfault.com/a/685328/269155) 和 [此处](https://serverfault.com/a/1005322/269155) 了解更多详细信息。 (2认同)