我在 Debian 上有一个大型(> 100TB)ZFS (FUSE) 池,它丢失了两个驱动器。由于驱动器出现故障,我用备件替换它们,直到我可以安排停机并物理更换坏磁盘。
当我关闭系统并更换驱动器时,池开始按预期重新同步,但是当它完成大约 80% 时(这通常需要大约 100 小时),它再次重新启动。
我不确定一次更换两个驱动器是否会造成竞争条件,或者由于池的大小,重新同步器花费的时间太长以至于其他系统进程正在中断它并导致它重新启动,但是在“zpool status”的结果或指向问题的系统日志。
从那以后,我修改了我如何布置这些池以提高重新同步性能,但对让此系统重新投入生产的任何线索或建议表示赞赏。
zpool 状态输出(自上次检查以来,这些错误是新的):
pool: pod
state: ONLINE
status: One or more devices has experienced an error resulting in data
corruption. Applications may be affected.
action: Restore the file in question if possible. Otherwise restore the
entire pool from backup.
see: http://www.sun.com/msg/ZFS-8000-8A
scrub: resilver in progress for 85h47m, 62.41% done, 51h40m to go
config:
NAME STATE READ WRITE CKSUM
pod ONLINE 0 0 2.79K
raidz1-0 ONLINE 0 0 …Run Code Online (Sandbox Code Playgroud) 我有一台 NAS 服务器,带有 4 个 2TB WD RE4-GP 驱动器,采用 RAID10 配置(4TB 可用)。我的空间不足(剩余可用空间小于 1TB)。我有 0 美元可用于购买更大/更多驱动器/机箱。
我喜欢我读到的有关 ZFS 数据完整性特性的内容,这些特性本身就足以让我从现有的 XFS(软件)RAID10 切换。然后我读到了 ZFS 对 RAID5 的卓越实现,所以我想我什至可以使用 RAIDZ-1 在讨价还价的情况下获得多达 2TB 的可用空间。
不过,我一直在读更多和更 帖子说差不多,只是从不使用RAIDZ-1。只有 RAIDZ-2+ 足够可靠来处理“现实世界”驱动器故障。当然,就我而言,RAIDZ-2 没有任何意义。在单个池 (RAID10) 中使用两个镜像 vdev 会好得多。
我是不是很想将 RAIDZ-1 用于 4 个 2TB 驱动器?
我应该只使用一个包含两个镜像 vdev(基本上是 RAID10)的池,并希望压缩能给我足够的额外空间吗?
无论哪种方式,我都计划使用压缩。我只有 8GB 的 RAM(最大),因此无法进行重复数据删除。
这将在 FreeNAS 服务器上(即将替换当前的 Ubuntu 操作系统)以避免 ZFS-on-Linux 的稳定性问题。