确定导致服务器重启的原因

nac*_*ito 8 hp hp-proliant diagnostic vmware-esxi

我有一台运行VMWare ESXi 5.5HP ProLiant DL380p Gen8。在过去的 24 小时内,它一直以看似随机的间隔重新启动。只有一个 VM 在运行,即使我关闭它,主机仍会重新启动。服务器没有耗尽内存或磁盘空间,据我所知也没有过热。我试过查看日志文件,但要查看的内容太多了。

诊断此问题的最重要步骤是什么(包括要检查哪些设置、要查看哪些文件、哪些特定消息表明存在问题、我是否应该开始提取内存、是否有诊断 CD 可以为我完成所有这些工作等) ?

我知道这是一个非常广泛的问题。如有必要,我很乐意提供日志文件,以使这更适合我的情况。

eww*_*ite 9

这里有一些建议。

  • 您的 ILO 是否已连接和配置?它将准确地告诉您系统发生了什么。请查看 ILO4 日志。

  • 查看系统的 IML 日志(可通过 ILO 或 vSphere“硬件”选项卡获得)

  • 崩溃期间或开机自检时屏幕上是否有任何指示或错误消息?

  • 您是否使用 HP 特定的 ESXi 安装(包括额外的驱动程序和工具)

  • 您运行的是什么版本和内部版本号的 ESXi?

  • 如果您运行的虚拟机是 Windows 2012 或 2008 来宾,您可能会遇到 NIC 驱动程序错误

  • 检查您的电源连接。你有双电源吗?一次重新安装一根电源线。

  • 查看服务器正面的 System Insight LED 阵列以确定是否存在内部运行状况问题。

在此处输入图片说明

  • @nachito 我希望您知道国际劳工组织和服务器可以通过电子邮件向您发送健康警报,例如这种温度条件... (3认同)
  • 并致电供应商寻求支持。您可以也应该花一些时间调查自己,但如果这是一个重要的服务器,它应该受支持协议的约束。 (2认同)