我正在运行 FreeNAS 9.3 的供应商特定衍生产品。
当我安装了一个新的 JBOD 机箱以将两个新的 vdev 添加到我的池中时,我的麻烦就开始了,而机箱的板子有问题。在此期间,我看到坏板上的驱动器出现 SAS 电源错误——我的新驱动器每分钟反复有效地打开和关闭。
我更换了主板,现在,从大多数角度来看,驱动器运行良好,但是当我查看zpool status
. 我认为当我遇到 SAS 电源问题时,有一些糟糕的 CoW 写入。
带有 CPU、引导驱动器、RAM 等的第一个机箱通过 mini-SAS 连接到第一个扩展 JBOD 机箱,第二个 JBOD 扩展机箱通过第一个 JBOD 扩展机箱菊花链连接,也通过 mini-SAS。
校验和错误并不能完美地映射到任何一个控制器或机箱,但我的预感是,当我遇到这些电源问题时,无论写入到不同新磁盘的任何数据都在两个新 vdev 上写入错误。
我的 HBA 使用了良好的 LSI 固件——全部都在 20.00.04.00 或 20.00.08.00
我已经更换了迷你 SAS 电缆,并尝试使用不同的端口,但无济于事。
的输出zpool status
显示在两个新 vdev 上累积的校验和错误,并且在经过清理、重新启动或 之后zpool clear
,最终将zpool status
这些 vdev 标记为已降级。奇怪的是,它还将 …
我有两个企业级 SSD,我已经L2ARC
在OpenZFS
池中使用了几年。这段时间的工作流程相当繁重,有大量的读取和写入,为客户提供视频以进行视频后期制作。
最近,收到了一些关于 L2ARC SSD 的严重警报:
CRITICAL: Oct. 22, 2018, 6:12 p.m. - Device: /dev/da0 [SAT], 215869351264256 Offline uncorrectable sectors
CRITICAL: Oct. 22, 2018, 6:12 p.m. - Device: /dev/da1 [SAT], 174264003067904 Offline uncorrectable sectors
Run Code Online (Sandbox Code Playgroud)
显然没有数据丢失的风险,因为这些只是 L2ARC,但是是时候更换它们了吗?
我是在牺牲性能吗?如果没有,有没有办法重置或忽略坏扇区?
使用FreeNAS-11.1-U6
.