使用 Samsung 850 Pro SSD 的 LSI 9207-9i (SAS2308) 上的 ZFS cksum 错误

Chr*_*ing 5 zfs ssd lsi

我正在测试连接了 8 个 Samsung 850 Pro 256GB SSD 的 LSI 9207-8i 控制器。SSD 运行最新固件 EXM02B6Q,控制器运行 P17,并出现与 P19 相同的问题。服务器RAM是ECC并且已经在镜像模式下进行了测试。

我已经使用 ZFS-On-Linux 和 FreeBSD 进行了测试,并在这两种操作系统上尝试了 LSI 的驱动程序。

磁盘的行为符合预期,但在大量 IO 期间,它们似乎写入了坏块。在磁盘上运行清理时,会出现校验和错误。为了模拟繁重的 IO,我使用了 16k 的记录大小,primarycache=metadata 和 secondarycache=none。我生成一个 4GB 随机文件,并将其添加到 4 个线程中的另一个文件中。循环几次就足以让清理显示校验和错误。

尚未确认这是否是控制器、SSD 或电缆的问题。我怀疑 SSD,但下次有机会会使用 9211-8i 进行测试。

有没有人遇到过类似的问题,或者除了更换控制器/SSD 之外,有没有人对下一步该怎么做有任何建议?

更新:已使用板载 SATA 控制器在完全不同的服务器上测试了另一台带有 EXM01B6Q 固件的三星 850 Pro 256GB。校验和也会出现同样的问题。

小智 5

我过去在使用三星 850 Evo 时也遇到过这个问题。这些驱动器在 OmniOS/OpenSol 中显示为 512K 对齐,因为它缺少 ashift 参数,所以您会遇到此问题。这似乎是磁盘本身的某种垃圾收集问题,我会写入大量数据,进行擦洗,然后看到错误。

我们最终强制磁盘在 sd.conf 中显示为 4K 对齐,然后 ZFS 开始正常运行。

我想我会提出这个问题,以防其他人遇到同样的问题。


eww*_*ite 0

我怀疑面向消费者的三星 850 SSD 或驱动器背板,假设此配置中有一个。

这主要是因为您在两个不同的操作系统上遇到错误。您能提供有关硬件配置的任何其他详细信息吗?