Ste*_*ker 4 central-processing-unit vmware-esxi
在 CPU 使用率飙升后,VMWare ESXi 5.5 的主机服务器对 DRAC、网络和集群成员资格无响应。
主机是刀片模块,是戴尔 M1000e 机箱中的戴尔 PowerEdge M820,带有 4 个至强 E5-4620s 和 128 GB RAM 以及 RAID 6 中的本地 SSD。
所有 VM 都是 Server 2008 R2。有一台 SQL Server 使用 SSD RAID 存储数据。否则,VM 将存储在具有 10 Gbit 链接的 QNAP 上。
资源没有过度投入。
刀片模块或 QNAP 上从未记录或指示任何硬件故障。
服务器需要从 M1000e DRAC 冷重启才能再次运行。
这似乎是某种类型的 VMWare 故障,硬锁定了硬件,但是在踢它之前 3 个月,锁定前的日志丢失了。
由于重新启动 -VMWare 和服务器硬件没有报告或指示任何问题。
有没有其他人经历过这样的事情?任何想法,想法,建议?
这可能是您的 Windows VM 的问题。您能告诉我们 Windows 虚拟机正在使用哪些网络驱动程序吗?英特尔e1000?英特尔e1000e?VMware vmxnet3?
如果他们没有使用 VMware vmxnet3,您就会遇到一个可怕的错误,该错误会在主机崩溃 (PSOD) 中表现出来。参见相应的知识库文章#2059053
这是 5.5 ESXi 主机在 Windows Server 2008R2 和 Windows Server 2012 虚拟机之间进行大量网络活动后崩溃的痕迹。
修复方法是迁移到 vmxnet3 驱动程序。这让很多人感到困惑,因为 e1000/e1000e 是创建 Windows 虚拟机时的默认设置。