z2k*_*z2k 8 storage-area-network disk-space-utilization diskmanagement
我不是 SAN 的专家,我写这篇文章是为了获得一些关于我们的供应商似乎无法解决的持续和令人恼火的问题的线索。
我们拥有配备 16 x 2 Tb 磁盘的 ENHANCE ES3160P4 SAN,已为我们的视频监控系统提供。SAN 已由供应商配置为使用 RAID 5 阵列中的 14 个磁盘,其中 2 个磁盘是全局备用。RAID 通常分为 2 个大小相等的虚拟磁盘,这些虚拟磁盘跨越整个 RAID 空间。每个结果都超过 12 Tb。每个虚拟磁盘对应一个 LUN,该 LUN 连接到单个视频服务器,该服务器连续存储视频数据并允许用户在需要时检索录像。LUN 使用 NTFS 格式化并通过 iSCSI 连接到 Windows Server 2012 视频服务器。视频服务器倾向于充分利用他们拥有的可用空间。
在这种配置下,SAN 的磁盘故障不断,每次 SAN 都无法恢复 RAID,因为同时另一个磁盘发生故障。在过去的几个月里,我们失去了 4 次 RAID。
这个问题似乎不是由一个坏的 SAN 样本引起的,因为我们拥有其他三台相同类型的机器,它们似乎有同样的问题。只有一个没有问题,但目前它没有得到充分利用。
经过几个月的未知测试和检查,供应商最终表示众所周知,SAN 不应 100% 使用,否则它会快速退化,物理上也会退化,并表示应该创建虚拟磁盘来解决问题保留 RAID 中可用总空间的 10-15%。
我在网上搜索了这个问题,并没有找到具体的说法。在我看来,创建跨越整个 RAID 的虚拟磁盘然后未充分利用 LUN 会更合理(即,允许 Windows 拥有可用空间并避免碎片化)。如果不是,我不明白为什么 ENHANCE SAN 允许创建跨越整个 RAID 的虚拟磁盘,如果它是如此“众所周知”以至于必须留下一些可用空间,以及为什么供应商在开始时配置系统……但这是另一点。
最后,我们要解决这种情况。任何建议都被接受。如上所述,我不是SAN专家,但经过这么多问题,我想真正了解供应商是否知道发生了什么,因为我们不能再接受这种情况。
提前谢谢了!问候
编辑:磁盘类型 从答案看来似乎是相关信息,我补充说磁盘都是西部数据型号 WD2001FYYG-01SL3。
Sve*_*ven 10
根据您的描述,主要问题是他们决定将 RAID5 用于如此大的阵列,这对于此设置来说是一个非常糟糕的选择,这正是您遇到的原因:在恢复期间第二个磁盘出现故障会破坏一切,而这第二次失败很可能会冒这个险。
如果他们使用了例如 RAID6,那么在恢复期间出现第二个磁盘故障不会导致阵列故障并且恢复可以正常进行,代价是一个磁盘的净存储容量和一定的性能影响。
我看不出留下 15% 的可用空间对解决这个问题有什么帮助,虽然从文件系统的性能角度来看,这可能是也可能不是一个好主意,但这显然与失败的 RAID 无关。我称之为废话。
说了这么多,我不禁想知道:即使对于 RAID5 系统来说,在几个月的时间里多次发生这种情况似乎也太过分了。我建议查看使用的磁盘类型 - 可能是您的供应商使用了廉价的台式机驱动器,而不是经认证可在此类系统中使用的 24/7 驱动器。