我试图找出将 24x 本地连接的 SSD 配置为具有低价值数据的大型逻辑卷的最低麻烦方法。我将它们用作主状态(大约 PB 级)驻留在 S3 中的数据的热设置缓存,因此与丢失的数据相比,我更关心性能、维护的复杂性和停机时间。没有任何东西会在热数据集中停留超过几天,无论如何都可以轻松地从 S3 重新创建。
我认为 RAID 5 是不可能的,我不可能等待手动重建。我倾向于使用 RAID 0、RAID 10 或......也许这实际上是一个根本没有 RAID 的简单 LVM 池的情况?在这种情况下,走相对简单的路线,我真的会失去任何东西吗?
我的理想解决方案是将每个/子目录(每个子目录都有一个自包含的数据集)完全包含在单个磁盘上(我可以在每个驱动器上安装 10 个子目录)。如果驱动器出现故障,我会暂时中断该驱动器上的子目录/数据集,但很容易推断“这些数据集正在重新下载但不可用”。然后我只是在新驱动器上从 S3 重建丢失的数据集。我怀疑 LVM jbods(不确定这个词的确切含义?)可能最接近复制这种行为。