标签: failovercluster

server 2016 活动目录和 hyper-v 相同的服务器

我准备将我的生产环境从 server 2012 R2 移动到 server 2016

我想进行全新安装,并且在进行一些清点时,实际上只有两台服务器可用于暂存,我希望能够进行全新安装。

我已经阅读了几篇关于安装 Active Directory 和 hyper-v 同一服务器的最佳实践的文章。

我的应用很轻量ant 这将是一个交错的迁移,所以我的计划是使用两台服务器(2016年数据中心),将它们集群起来,将2012年的guest逐一添加(滚动升级),然后在clean时将它们添加到服务器 2016 我在生产中。

我想要做的是将 AD DS 添加到我的两台服务器创建一个子域复制 AD,并添加还添加 hyper-v 角色,以及 DNS 服务器、故障转移群集、文件和存储服务、多路径 I/O

会不会有什么冲突。

hyper-v failovercluster windows-server-2016

16
推荐指数
1
解决办法
1803
查看次数

如何搭建一个高可用的Postfix系统?

我需要为 postfix 服务器设置一个远程镜像(两个邮件服务器的内容在任何时候都应该是相同的)。

这个想法是,如果主服务器在某个时候出现故障,镜像服务器将取代它,管理新传入的邮件,当电子邮件服务器再次启动时,它将用新电子邮件更新它并返回它是管理新传入邮件的控件。

邮件服务器将托管在不同的地方(即 maindomain.com、themirrorsite.com)。

获得一个简单的备份服务器似乎并不太难:

但问题是这种配置不会使备份站点成为主邮件服务器的完整镜像(它只会保存主服务器关闭时收到的电子邮件)。

有没有办法实现所需的配置?

backup postfix mirroring failovercluster

13
推荐指数
2
解决办法
4万
查看次数

VMXNET3 接收缓冲区大小和内存使用情况

背景

我们遇到了一个 Windows 故障转移集群中断的事件。验尸结果显示该节点已被“删除”,如本文所述

我们最近才将该集群完全迁移到我们的 VMware 环境中,看来上述事件可能是导致中断的原因。

与此相关的 VMware KB 文章讨论了增加Small Rx BuffersRx Ring #1设置,但警告说,增加太多可能会大大增加主机上的内存开销。

Network Interface\Packets Received Discarded对我们约 150 个 Windows VM的性能计数器进行审计后,16 个来宾中的 22 个 vNIC 有一些丢弃的数据包。

一个足够小的数量,我不担心使用额外的内存对主机造成负担,但我想了解这些设置如何使用内存以及内存来自哪里。

问题

  1. 缓冲区数量和环大小之间有什么关系?
  2. 如何计算这些设置的给定值所使用的内存量?
  3. 因为这些设置在来宾操作系统中的 NIC 本身上,所以我假设它们是驱动程序设置。这让我认为使用的 RAM 可能是分页或非分页池。
    1. 这样对吗?
    2. 如果是这样,我应该担心吗?
  4. 有没有我在这里没有考虑到的问题?

我们正在尝试确定在受影响的 VM 上将这些设置为最大值是否存在缺陷,而不是 VMware 主机内存使用情况。例如,如果我们增加了来宾中池内存耗尽的风险,我们更倾向于从小处着手。

这些问题中的一些(可能是全部)可能不是 VMware 或虚拟化所特有的。

networking windows vmware-esxi failovercluster

12
推荐指数
1
解决办法
8572
查看次数

为什么我的 HyperV 虚拟机会随机失去连接?

我有一个奇怪的间歇性连接问题,大约每两周发生一次。

首先是我的配置:我正在运行一个带有两个物理主机(node01 和 node02)的 HyperV 故障转移集群。主机都运行带有 SP1 的 Windows Server 2008 R2 HyperV 服务器(免费的)。在这些主机上,我运行了两个 VM,每个 VM 都运行带有 SP1 的 Windows Server 2008 R2 Web 版。我的存储服务器是通过 iSCSI 连接的 Windows Storage Server 2008。主机和存储服务器都运行直接从英特尔网站下载的最新网络驱动程序。

问题是:在 99.99% 的情况下,一切正常。大约每两到三周一次,VM 将同时失去传入和传出的网络连接。当这个情况发生时,

  1. 我无法 RDP 到任一 VM。
  2. 我可以 RDP 到任一主机。
  3. 我可以通过右键单击节点并选择“连接到虚拟机”从故障转移群集管理器连接到任一 VM
  4. 一旦我按照上面 #3 中的描述连接到 VM,我就无法访问 LAN 上的任何网站或机器。禁用并重新启用 VM 内的虚拟网络连接并不能解决问题。
  5. 如果我将 VM 移动到不同的节点,就可以解决问题(在接下来的两周内)。
  6. 如果我重新启动主机并将 VM 移回主机上,就可以解决问题(在接下来的两周内)。
  7. 发生这种情况时,故障转移群集不会自动对 VM 进行故障转移。
  8. 任何主机或 VM 上都没有异常事件日志条目。

这种情况已经发生了大约 5 次,症状与上述相同。我怀疑是网络驱动程序或网络硬件问题,但由于我已经在运行最新的驱动程序,我不知道该怎么办。

这真是令人头疼……有什么想法吗?

更新

我在这里发现了一个非常相似的案例:虚拟机失去了 Hyper V 集群上的网络连接

2011 年 7 月 29 日更新 …

networking failover hyper-v hyper-v-server-2008-r2 failovercluster

10
推荐指数
3
解决办法
7万
查看次数

有什么办法可以防止 Storage Spaces Direct 自动添加磁盘?

在托管使用存储空间直通 (S2D) 的 SQL 故障转移群集实例 (FCI) 的 2016 年 Windows Server 故障转移群集 (WSFC) 上遇到问题。在每台服务器上,初始创建成功后,S2D 会自动将一个其他未使用的 RAID 卷添加到存储池中(尽管 S2D 无法在 RAID 卷上创建,并且绝对坚持未突袭的磁盘)。现在它坏了,因为——据我所知——正是这样。结果,虚拟磁盘处于脱机状态,整个集群也随之宕机。由于缺少集群网络资源,它不会重新联机。有问题的磁盘可以报废,但不能删除。虚拟磁盘修复未运行,群集兼容性测试声称配置无效。

这是一个新的设置。所以我可以简单地删除虚拟磁盘、集群甚至服务器,然后重新开始。但在我们提高生产力之前,我需要确保这种情况不会再发生。仅仅通过不必要和错误地添加不受支持的磁盘而使系统在虚拟膝盖中自行崩溃的系统不是我们可以部署的平台。所以主要我需要一种方法来防止这种情况发生,而不是现在就修复它。我的猜测是,防止 S2D 设置获取比创建时更多的磁盘会成功。在真正的磁盘更换过程中可能需要更多手动交互的成本对于集群来说可以忽略不计......我们在这里。到目前为止,尽管我浏览了文档,但我找不到任何方法来控制它。除非我遗漏了什么,否则 Set-StoragePool,

任何帮助或提示将不胜感激。

以下是有关上述内容的更多详细信息: 我们有 2 台 HPE DL380 Gen9 服务器机器,它们通过支持 RDMA 的 10GB 以太网相互连接,并通过 1GB 连接到客户端网络。每个功能一个 RAID 控制器 HP ??? 和一个简单的 HBA 控制器 HP ??? (因为 S2D 绝对需要并且仅适用于直接连接的、未受攻击的磁盘)。存储配置包括 RAID 控制器上的 OS-RAID、RAID 控制器上的 Files-RAID 以及 HBA 上用于 S2D 的一组直接连接的磁盘。

我在 OS-RAID 上设置了 2 个 Windows Servers 2016 数据中心版本,安装了 WSFC 功能,运行并通过了包括 S2D 选项的集群兼容性测试,创建了没有存储的集群,添加了文件共享见证(在单独的机器上),启用了 S2D在存储池上,它自动包含所有未突袭的磁盘,并在该池的顶部创建了一个镜像类型的虚拟磁盘并使用 NTFS 作为文件系统,因为这应该是 SQL FCI …

failovercluster storage-spaces windows-server-2016

9
推荐指数
1
解决办法
6667
查看次数

故障转移群集如何在 Windows 2008 R2 中工作?

我正在尝试了解故障转移群集功能如何与 Windows 2008 R2 配合使用,因为我将作为 SQL Server 2012 的一部分始终开启使用。

我已经能够找到有关如何设置它以及它的作用的信息。但是,我很难找到一个很好的技术文档,详细说明它是如何实际工作的(例如,使用 keepalived 有一些文档解释了心跳数据包的发送频率,它们的外观等)。

我知道这是一个非常广泛的问题,但我想很好地了解此功能的机制。

windows windows-server-2008-r2 failovercluster

8
推荐指数
1
解决办法
1789
查看次数

SAN 重建后无法销毁 Windows 2008 r2 故障转移群集

我为 sql 2008 主动/被动集群创建了一个 windows 2008 r2 故障转移集群。这个双节点集群使用 SAN 设备作为仲裁磁盘资源以及 MSDTC 资源。

嗯....我决定重新配置SAN设备,但我没有先破坏集群。现在quorum磁盘和mstdc磁盘完全没有了,集群显然不工作了。但是,我什至无法摧毁集群并重新开始。我已经尝试过 Windows 集群工具以及命令行。我能够让集群服务开始使用“/fixquorum”参数。执行此操作后,我能够从群集中删除被动节点,但它不会让我破坏群集,因为默认资源组和 msdtc 仍作为资源附加。我试图从 GUI 工具和命令行中删除这些资源。它会冻结几分钟并使程序崩溃,或者一旦它甚至使服务器蓝屏。

有人可以建议如何销毁此集群以便我可以重新开始吗?

high-availability windows-server-2008-r2 windows-cluster failovercluster

7
推荐指数
1
解决办法
1612
查看次数

高可用性虚拟机

我通过 Hyper-V 或 VMWare 阅读了很多关于高可用性虚拟化的文章。在这种情况下,本质上的高可用性意味着 VM 由一组物理服务器(节点)托管,因此如果其中一个物理服务器出现故障,该 VM 仍然可以由其他物理服务器提供服务。到目前为止一切顺利,物理集群和 VM 本身是高度可用的。

但是,如果提供的服务,比如说 SQL 服务器、MSDTC 或任何其他服务,实际上是由 VM 映像和虚拟化操作系统提供的。所以我想虚拟层仍然存在未考虑的故障点。虚拟机本身可能会发生物理集群无法解释的事情,对吗?在这种情况下,物理故障转移群集 (Hyper-V) 或 VMWare 主机无法进行故障转移,因为问题不在于物理群集中的一台服务器 - 故障转移物理节点不会有任何好处。

这是否需要在物理集群之上构建一个虚拟故障转移集群,或者这不是必要的?

或者,我想您可以跳过物理集群,而只在虚拟层进行集群(基于子故障转移集群),因为它应该仍然可以在物理故障中幸免于难。

请参阅下图,显示基于父项(左)、基于子项(右)和组合(中心)。是根据您的需要以父母为基础,还是以孩子为基础更合适?

聚类示例图像

windows-server-2008 cluster vmware-esx failovercluster

7
推荐指数
4
解决办法
571
查看次数

Hyper-V 存储在 CSV 上的糟糕表现

我最近设置了一个新环境,包括:
- 带有 10Gib 网络的 QSAN 存储
- Mellanox 交换机 10Gib
- 4 个物理节点连接到 LAN 和 SAN 10Gib

物理主机使用 MPIO 连接到 SAN 存储,在所有连接到 SAN 的物理服务器上进行了性能测试,并显示单个 SSD(在集群中以 CSV 形式存在)的 8K 随机写入 200MB/s。该测试是使用 diskspd 进行的。

现在我在集群共享卷上创建了一台 Hyper-V 机器并在虚拟机内测试了 diskspd:8k 随机写入:0.5MB/s

在检查 Hyper-V 来宾内部磁盘的延迟时,我看到类似 10 秒的值。

我很困惑为什么会这样。我想这不是 SAN 存储,也不是 ISCSI 或 MPIO 设置,因为我在物理主机上进行测试时得到了预期的结果。所以Hyper-V的配置肯定有问题。

我正在 Hyper-V 来宾中的 C: 驱动器上进行测试,这是一个固定大小的 IDE 驱动器(因为 SCSI 将无法启动)。SAN 卷使用 64k...

CSV 与 Hyper-V 来宾属于同一主机,...

更新:不幸的是,Guest-VM 是第 1 代。

cluster storage-area-network failovercluster windows-server-2012-r2 cluster-shared-volumes

7
推荐指数
1
解决办法
1744
查看次数

内部存储作为 HA 故障转移集群存储池?

我有 2 个 HyperV 服务器(2012 R2)节点,在故障转移群集中共享 ISCSI 存储(ubuntu 16.04)。

我想让那 3 个服务器(windows server 2016 和/或 2012r2)每个都有 2 个分区,一个用于系统,另一个用作存储。

如果我必须在其中一台服务器上进行维护,我将如何进行这项工作?

有了我现在所拥有的,我将虚拟机传输到工作节点并在第二个节点上进行维护,存储在外部它不会对虚拟机进行任何更改。根据我的想法,关闭一台服务器会使其存储不可用,并且其上的所有内容都会随之崩溃。

现在存储服务器的所有磁盘都在硬件 RAID 1+0 中,因此如果磁盘出现故障,它不会对服务器造成问题,如果其中一台服务器,是否可以为集群做同样的事情必须关闭?

我读过使用硬件和软件突袭是不行的,但我不明白如果没有两者,我怎么能做到这一点?

如果我在故障转移集群中创建一个存储池,是否可以关闭一台服务器,并在我将其恢复时更新其存储,而不会使 vms 不可用?

我是否需要将所有数据从存储中转移到一个可以保持状态的数据,然后在服务器上进行维护,然后将其全部重新传输回来?或者我继续使用外部存储并希望永远不需要关闭它,因为它几乎是相同的问题?

一些注意事项:旧服务器 HP proliant Gen 7、Dell Poweredge Gen 12 和 IBM Server X5。此外,无法获得其他 RAID 控制器,我获得了这些服务器中的任何内容,因此没有直通、JBOD 等

windows raid storage failover failovercluster

7
推荐指数
1
解决办法
212
查看次数