所以我们有了这个4 节点存储空间直通 (S2D) 集群,运行超过 1.5 年没有任何重大问题。操作系统为Windows Server 2016。
两天前,我们注意到集群事件日志中有很多或错误消息,并且集群上托管的所有 Hyper-V 虚拟机的备份作业都失败了(通过 VEEAM 制作)。
调查很快表明SMB 连接存在许多问题。
4 台主机中的任何一台:
net time \\server失败,也是w32tm /monitor)显然,文件共享见证也失败了,并且要报告域服务的一些问题......
我们尝试单独重新启动节点,重新启动后 SMB 连接就好了......几分钟/几小时,然后问题再次出现。
对集群的影响以及文件共享见证离线,是我们无法轻松地在节点之间执行VM的实时迁移(随机成功)。不过,快速迁移就像一种魅力。由于无法进行 SMB 连接,我们无法将 VM 移动到另一个集群或独立主机。
我们担心如果节点失控,集群会失控。即使 VM 是稳定的,我们仍然无法执行备份(我们可以执行导出)。
你们中有人听说过 S2D 或 Microsoft 故障转移群集角色的问题吗?它也可能与集群本身无关...... …
hyper-v failovercluster storage-spaces windows-server-2016 smbclient