Raid 10 性能问题

maz*_*lon 3 raid starwind windows-server-2019

我正在为我们的业务设置镜像存储系统。

我们没有预建的预算,所以我正在尽我所能,让我们的钱得到最大的回报。这是我们的硬件故障:

San1 和 San2 Windows Server 2019

SUPERMICRO MBD-H11SSL-I AMD Epyc 7251 8 核 CPU

64GB 内存 8GB x8

操作系统 SSD 500GB

LSI 9380-8i8e

Intel 10G 网卡,4 端口 - Iscsi 网络

Intel 25G 网卡,2 端口 - 服务器之间同步 - Jumbo Frames-9014。

1 个内部网卡 1G(数据),1 个 IPMI 在 MB 上使用

IW-RJ224-03 24bay SSD 机箱,装有 24 个 2TB Samsung 860 Pros,Raid10 配置。通过 2 根 SAS 电缆连接到 9380 卡。

我们将使用 Starwind 来同步 2 个服务器。

在设置 Starwind 的过程中,我一直尝试使用从 500G 到 5TB 的不同图像大小来查看我们的同步性能

当同步开始时,写入同步数据的系统几乎不可用。系统卡顿,性能监视器挂起,一切都运行得很糟糕,除非我关闭所有缓存选项。如果我启用写回或启用磁盘缓存,我注意到 numa 0 peg 100% 上的 Core0 并且一切都向南...其他核心显示很少或没有使用,减去几个。

我已经尝试了各种驱动器设置组合来解决这个问题,但目前我一无所获。我肯定错过了什么。我已将阵列配置为 2x8、6x4 和 4x6(标准 64k 条带)设置,认为这是一些驱动器限制阻碍了我,但我有 1 个实例,没有出现任何问题,并且驱动器写入了 5TB 同步,没有任何问题,并在一个小时内实现完美的系统响应。当时在 4x6 阵列上启用两个缓存时,速度超过 1.6GB/s。我确实注意到 core0, numa0 当时接近空闲,而 core 2,numa 0 正在做繁重的工作。把所有东西都拆下来进行复制和重建,从此陷入困境。现在,在缓存关闭的情况下,每次传输的最大写入量约为 600MB,而在缓存关闭时,写入量约为 1GB/s,之后就会明显陷入困境。

任何帮助我指明正确方向的想法都将受到赞赏!9380 上的固件是最新的,Raid 卡、NIC 和 MB 组件的驱动程序都是最新的。

bat*_*a09 5

这里有一些想法,可能有助于解决问题:

\n
    \n
  1. 如果您使用某种 NIC 组合,它可能会以不可预测的方式影响 iSCSI 和复制的性能。大多数 SAN\xe2\x80\x99s/VSAN\xe2\x80\x99s 供应商不\xe2\x80\x99t 支持分组并推荐 MPIO。禁用 NIC 组合。
  2. \n
  3. 您提到了英特尔 25G 网卡。XXV710 型号可能在启用巨型帧时存在问题。禁用巨型帧并运行其他测试。
  4. \n
  5. 巨型帧值 9126 对于 Windows 操作系统来说并不典型,主要用于交换机。Windows 默认值为 9014。
  6. \n
  7. LSI 9380 在支持的驱动器列表中没有\xe2\x80\x99t Samsung 980 Pro。而且,980 Pro是NVMe驱动器(不是SATA)。您确定您拥有 980 Pro 吗?
  8. \n
\n

我\xe2\x80\x99d 还建议联系 Starwind\xe2\x80\x99s 支持,正如 BaronSamedi1958 提到的。

\n

  • 哎呀,我到处都是啊?是的,它们是 860 SSD...,是的,它是 9014...在 10 个小时的拉扯我的头发后,我很匆忙:)。我确实将其固定在未启用 numa 缩放的 710 25GB 网卡上。这立即解决了我遇到的问题。 (2认同)