如何管理整个数据中心的全局 VM 启动顺序?

Mas*_*imo 14 startup datacenter vmware-esxi vmware-vcenter vmware-vsphere

假设您有一个完全虚拟化的 VMware 基础架构:ESXi、vCenter、vMotion、HA、DRS,整个包。

在内部,您有许多 VM,它们在任何给定时间都可能驻留在一台主机或另一台主机上(这就是集群的全部意义,不是吗?)。

您遇到了断电的情况,并且以某种方式成功地关闭了所有 VM 和所有主机;我们暂时不深入研究这个问题,假设您的 UPS 软件可以处理它。或者,至少,让我们假设关闭不是那么优雅,但是一旦电源恢复,一切仍然能够再次出现。

电源恢复,您的主机重新启动。

您的环境非常复杂,并且它在 VM 之间具有天然的依赖关系:域控制器应该首先启动,应用服务器不能启动,除非它的后端数据库服务器已经启动并运行,等等。

我们都知道(或者应该知道)如何配置自动 VM 启动以及如何在单个 ESX/i 主机上指定 VM 启动顺序和延迟。

但是如何在整个数据中心内做到这一点呢?

有什么方法可以告诉 vSphere“以全局顺序启动这些虚拟机,而不管它们运行在哪个物理主机上”?

加分项:如果 vCenter 本身在虚拟机上运行,​​这会如何改变事情?

eww*_*ite 7

一旦在单个主机上配置了 HA,似乎没有一种干净的方法来完全管理虚拟基础架构冷启动。启用 HA 和 DRS 似乎禁用了主机服务器上的虚拟机启动和关闭选项。但是,在主机移入集群之前设置的任何排序似乎都成立。如果主机数量很少或易于管理,则可以通过分别连接到主机在 vSphere 客户端中设置启动优先级。把你的规则放在那里。这实际上适用于您描述的情况。

在此处输入图片说明

存储是第一位的!

共享存储启动后,我会在主机上工作……我也遇到了 vCenter 虚拟化的部分中断。在这种情况下,我所做的是为最关键的系统设置自动启动和订购选项;通常是域控制器和 DNS/DHCP。请记住,在冷启动场景中,vCenter 不太可能可用。如果我能适应它,那么我会……否则它会手动启动。

从那里,我确保 HA 和 DRS 规则完好无损。我通常为终端服务器、应用程序服务器和域控制器设置非关联规则。一旦 vCenter 出现,大部分问题都会得到解决。

几周前我遭遇了一次雷击,我的部分服务器机房瘫痪,包括包含存储网络的交换机刀片。一旦存储交换机端口被重新定位和重新编程,VMWare HA 就将所有东西都带回来了。

因此,此类问题属于真正的紧急情况或手动操作。我不希望在您描述的场景中自动启动系统环境。

编辑:

两周前,我遇到了一个 UPS 的断电事故。两个主机,VC 和一个 SAN/NAS 设备。一切都会自行恢复,我不必干预(我实际上在飞机上并在着陆时收到了消息)。