ZFS 不断出现故障同一设备

Sve*_*nnD 6 zfs zfsonlinux

我们的存储服务器有一些问题,就在我们有一个损坏的磁盘(WD 4TB RE SAS),尽管 raidcontroller(LSI MegaRAID 9271-8i)使磁盘保持在线(状态:ok)。只有媒体错误显示 1 个错误。我们决定保存并更换磁盘,在重新同步第二个和第三个磁盘时标记为(重新同步),尽管只有一个磁盘显示 1 个读取错误。今天 resilver 完成了(没有损坏,一切都好),我开始擦洗并遇到了这个:

zpool status
  pool: data
 state: DEGRADED
status: One or more devices could not be used because the label is missing or
        invalid.  Sufficient replicas exist for the pool to continue
        functioning in a degraded state.
action: Replace the device using 'zpool replace'.
   see: http://zfsonlinux.org/msg/ZFS-8000-4J
  scan: scrub in progress since Thu Jan 14 10:50:00 2016
    2.71T scanned out of 111T at 718M/s, 43h59m to go
    0 repaired, 2.44% done
config:

        NAME                     STATE     READ WRITE CKSUM
        data                     DEGRADED     0     0     0
          raidz2-0               DEGRADED     0     0     0
            br0c2                ONLINE       0     0     0
            br1c2                ONLINE       0     0     0
            br2c2                ONLINE       0     0     0
            br0c3                ONLINE       0     0     0
            br1c3                ONLINE       0     0     0
            br2c3                ONLINE       0     0     0
            r2c1                 ONLINE       0     0     0
            r1c2                 ONLINE       0     0     0
            r5c3                 ONLINE       0     0     0
            sdb                  ONLINE       0     0     0
            sdc                  ONLINE       0     0     0
            7196084230607724634  FAULTED      0     0     0  was /dev/sdai1
            r5c0                 ONLINE       0     0     0
            r0c1                 ONLINE       0     0     0
            r1c1                 ONLINE       0     0     0
            r3c1                 ONLINE       0     0     0
            r4c1                 ONLINE       0     0     0
          raidz2-1               ONLINE       0     0     0
            r5c1                 ONLINE       0     0     0
            r0c2                 ONLINE       0     0     0
            r2c2                 ONLINE       0     0     0
            r3c2                 ONLINE       0     0     0
            r4c2                 ONLINE       0     0     0
            r5c2                 ONLINE       0     0     0
            r0c3                 ONLINE       0     0     0
            r1c3                 ONLINE       0     0     0
            r2c3                 ONLINE       0     0     0
            r3c3                 ONLINE       0     0     0
            r4c3                 ONLINE       0     0     0
            br0c0                ONLINE       0     0     0
            br1c0                ONLINE       0     0     0
            br2c0                ONLINE       0     0     0
            br0c1                ONLINE       0     0     0
            br1c1                ONLINE       0     0     0
            br2c1                ONLINE       0     0     0

errors: No known data errors
Run Code Online (Sandbox Code Playgroud)

/dev/sdai1 在线并且 raidcontroller 没有显示任何错误(甚至没有媒体错误)。我可以尝试将磁盘联机/脱机吗?

更新:我尝试分离磁盘,但它拒绝这样做,我的印象是 raidz2-0 有 2 个奇偶校验磁盘(raidz2-1 也有 2 个),所以为什么我不能分离?

zpool detach data 7196084230607724634
cannot detach 7196084230607724634: only applicable to mirror and replacing vdevs
Run Code Online (Sandbox Code Playgroud)

小智 2

为什么要通过 RAID 控制器传递磁盘?使用 ZFS 时,JBOD 会更有意义。由于您的控制器,您可能会遇到问题。

无论如何,只需分离并重新连接磁盘即可保存。您还可以尝试更换磁盘(无需真正更换它:zpool Replace pool disk)

让它重新镀银并再次擦洗。