升级到 Ubuntu 22 后,ZFS 发送/接收可以帮助我从部分池丢失中恢复吗?

rpt*_*tb1 5 zfs data-recovery zfsonlinux ubuntu-22.04

我在 Ubuntu 下有一个长期运行的 ZFS 池,它已经经历了多次升级。从 Ubuntu 20 升级到 22 后,加密的文件系统拒绝挂载,但其余的似乎都正常。 在加密文件系统的根部zpool status -v报告永久错误ZFS-8000-8A 。我注意到 zfsutils-linux 的软件包版本从 0.8.3 到 2.1.5 有一个很大的跳跃。

该池仍然可以导入到 Ubuntu 20 系统,并且加密的文件系统仍然可以安装在那里。看起来还不错。更重要的是,我可以zfs send在 Ubuntu 20 和zfs receiveUbuntu 22 上进行操作,并取得了明显的成功。

如果我将zfs send整个池(或部分操作)从 Ubuntu 20 (ZFS 0.8.3) 升级到 Ubuntu 22 (ZFS 2.1.5) 并且操作成功,我是否会创建一个没有升级问题的池?也就是说,接收操作是否会构建一个与 ZFS 完全同步的池?或者链接是否会出现兼容性问题?

我对 zfs 发送/接收操作的级别了解不够,无法确保在 Ubuntu 22 下不会出现进一步的损坏。

如果有必要,我很乐意重新加密加密的文件系统,而不是发送原始文件。一切都将在本地发生。在本例中,Ubuntu 20 在连接了磁盘设备的 LXD VM 中运行,并且发送/接收管道不跨越任何网络。

请注意,我知道废弃整个池并从备份中恢复它的建议。我正在尝试恢复而不必诉诸于此,因为我似乎能够读取池。

所有磁盘都通过了长时间的 SMART 测试,并且在 Ubuntu 20 下清理池没有显示任何错误。

我很高兴被告知(带有引用)该错误仅限于加密文件系统,我可以替换它们并继续,而无需重建整个池,但我对 ZFS 内部结构了解不够,无法确定那。我很想知道如何找到答案。

rpt*_*tb1 1

我已经解决了这个问题,并在 zfs-discuss 邮件列表上发布了详细信息。我会将信息发布在这里,以防对其他人有帮助。我的解决方案确实涉及长时间的服务器停机。Ubuntu bug #1987190中提供了一些补丁,如果您不能容忍这种情况,它们可能会工作得更好。

我在 GitHub 上发现了几个与我的问题相关的 ZFS 问题:

该错误与使用旧 ZFS 版本的本机加密创建的文件系统中的元数据有关。

我是这样修复水池的:

  1. 使用新的 ZFS 池在外部驱动器上安装 Ubuntu 22,并在该驱动器上启动服务器。

  2. 在该系统的 VM 中运行 Ubuntu 20,并将服务器的池成员磁盘附加到该 VM。

  3. 将旧池导入到虚拟机中。

  4. 在虚拟机中挂载“损坏的”文件系统。

  5. zfs 从 VM 中的旧池发送到主机系统中新池中的 zfs 接收。这修复了元数据。

  6. 检查、再检查、确认所有数据均已完成。(我在 .zfs/snapshot 中的关键快照上使用了 rsync -n --checksum。)

  7. 扩展 SMART 测试并对旧池进行全面擦洗。

  8. 将服务器启动回 Ubuntu 22。无需回滚。

  9. 从外部磁盘导入新的 ZFS 池。

  10. 销毁损坏的文件系统。

  11. zfs 从新池发送到旧池,重新创建损坏的文件系统。

我这样做是因为我对旧水池的完整性感到怀疑,并且不想过多地碰它。事实上,我认为我可以继续在 Ubuntu 22 的旧池上运行服务器,并在服务器上启动 Ubuntu 20 VM。但是,如果操作系统本身的文件系统损坏,这当然会失败。

我希望这可以帮助其他人解决这个问题。