NFS v4、HA 迁移和客户端上的陈旧句柄

Kar*_*zke 3 nfs migration high-availability pacemaker

我正在使用 Pacemaker/OpenAIS 管理运行 NFS v4 的服务器。NFS 配置为使用 TCP。当我将 NFS 服务器迁移到 Pacemaker 集群中的另一个节点时,即使元数据被保留,来自客户端的连接也会“挂起”并最终在 90 秒后超时。90 秒后,旧的挂载点变为“陈旧”,无法再访问挂载的文件。

90 秒宽限期似乎是服务器配置的一部分,而不是客户端配置。我在服务器上看到此消息:

内核:NFSD:开始 90 秒宽限期

如果我在迁移(卸载然后重新安装共享)后重新启动客户端节点上的 NFS 客户端,则不会遇到该问题,但连接和文件传输仍然中断。

三个问题:

  1. 什么是 90 秒宽限期?它有什么用?
  2. 将 NFS 服务器迁移到另一个节点后,如何在不重新启动客户端的情况下防止文件在客户端上过时?
  3. 实际上是否可以在不丢失大文件上传的情况下迁移 NFS 服务器?

All*_*len 5

NFS 在服务器上存储了很多客户端的状态。Pacemaker/OpenAIS无法弥补NFS在这方面的不足。宽限期是服务器和客户端重新捕获状态的时间。这是协议的一部分。

无论如何,您似乎并没有完全改变客户端状态(例如 /var/lib/nfs 内容)。有关想法以及需要在服务器端按状态同步的内容,请参阅内容。