背景:
我们需要随时访问 30TB 的音频数据,尽管只有其中的一小部分需要播放,即使是多年旧数据也需要立即播放。数据驻留在多个阵列的 SAN 中,并对新数据执行夜间备份。一些数据也会每晚删除。由于两者都是写入事件,因此称其为每晚 20GB。总体趋势是写入的新数据多于删除的旧数据。
每周巡逻读取 (PR) 和一致性检查 (CC) 占阵列上的大部分磁盘活动,除了它们只是旋转直到它们失败。
问题:
我想弄清楚是否应该将基于磁盘的 SAN 替换为使用 NVMe 的 SAN,要考虑什么 RAID 级别,以及降低 VNAND 技术的 PR 或 CC 活动频率是否有意义?
根据我的理解,杀死 VNAND 的是写入,即使考虑到一致性检查,我们在大多数驱动器上写入的数据也将少于每日最小值。
我几乎没有在 NVMe 甚至 SSD 上找到 RAID 5/6 的测试。我主要追求长期可用性。
研究:
与此主题相关的大多数其他问题早于 NVMe 技术,并且已有 6-7 年的历史。这是一个例外,但也没有真正涵盖这种情况。
了解 NVMe 存储和硬件要求
通过使用 SSD 而不是 HDD,您将获得一些功耗优势,并可能获得可靠性优势(企业级 SSD 比企业级 HDD 可靠得多)。nand 耐力没有问题,尤其是在您进行的活动水平上,甚至在更高水平上,耐力也不是真正的问题。您很可能还可以选择相对便宜的读取优化驱动器(具有 0.3 DWPD),并且不用担心磁盘耐用性。
这种用例中的唯一问题是驱动器的成本是否能保证其功率和可靠性优势。
至于可靠性/可用性,我见过的所有企业级 SSD 都标称 MTBF 为 200 万小时,而我使用过的 SSD 都超过了这一数字。相反的一面是,所有企业级 HDD 都声称具有 120 万小时的 MTBF,但没有一个达到这个值的一半,因此您会看到随着这一举措,可靠性大幅提升。再说一遍,是否真的值得,这取决于你的计算。
我的资格是,我从事涉及 HDD 和 SSD 的企业存储系统工作,并从事硬件/软件集成工作,并深入参与了组合系统的可靠性。我所依赖的数据集是私人的,因此我没有可以指出的公开研究。