Windows Server 2008 R2 无缘无故自行关闭

boo*_*t13 6 windows-server-2008-r2 hpe

我们的新服务器已经运行了几个月基本正常。然而,它两次无缘无故地自行关闭。

最近一次发生在几天前的晚上 11 点 41 分。事件日志没有显示任何不妥之处,最后一个条目是安全日志中相当普通的审计条目。UPS 日志显示没有电源问题。没有什么特别的东西在运行,因为它是在几个小时之后。当然除了晚上 10 点开始的夜间备份。备份日志也没有显示任何有趣的内容,只是在备份过程中停止。尽管服务器配置为写入内核转储并重新启动,但没有内存转储并且系统没有重新启动。它是 HP Proliant ML330 G6 系列服务器。

第二天早上手动重新启动服务器时,记录了以下事件:

Log Name:      System
Source:        EventLog
Date:          4/16/2011 8:20:22 AM
Event ID:      6008
Task Category: None
Level:         Error
Keywords:      Classic
User:          N/A
Computer:      XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description:
The previous system shutdown at 11:41:26 PM on ?4/?15/?2011 was unexpected.
Run Code Online (Sandbox Code Playgroud)

Log Name:      System
Source:        Microsoft-Windows-Kernel-Power
Date:          4/16/2011 8:20:00 AM
Event ID:      41
Task Category: (63)
Level:         Critical
Keywords:      (2)
User:          SYSTEM
Computer:      XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description:
The system has rebooted without cleanly shutting down first. This error could be
caused if the system stopped responding, crashed, or lost power unexpectedly.
Run Code Online (Sandbox Code Playgroud)

Log Name:      System
Source:        USER32
Date:          4/16/2011 8:22:34 AM
Event ID:      1076
Task Category: None
Level:         Warning
Keywords:      Classic
User:          XXXXXXXXXXXXXXX\Administrator
Computer:      XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description:
The reason supplied by user XXXXXXXXXXXXXXX\Administrator for the last unexpected 
shutdown of this computer is: Other Failure: System Unresponsive
Reason Code: 0x8000005
Problem ID: 
Bugcheck String: 
Comment: 
Run Code Online (Sandbox Code Playgroud)

我花了一些时间研究这个,发现很少用。谁有想法?

更新:以下是 iLO2 日志的相关部分:

305 04/15/2011 23:42:00 Server reset. 
306 04/15/2011 23:42:00 Server power removed. 
307 04/15/2011 23:42:00 iLO 2 network link down. 
308 04/15/2011 23:42:00 iLO 2 network link up at 100 Mbps. 
309 04/16/2011 08:17:00 Server power restored. 
Run Code Online (Sandbox Code Playgroud)

更新:我增加了分页文件的大小以允许完整的内核转储,所以如果它真的是 Windows 崩溃,我将能够看到发生了什么 - 下次发生时。

更新:服务器固件已经是最新的。

更新:有很多可用于驱动程序和系统软件的更新。我已经安装了其中的大部分,现在我只是在等着看问题是否再次发生。

2018Jun06 更新:经过六年的无故障运行,这个问题又回来了,在上周左右发生了两次。我正在调查前面板及其接线是否有问题的可能性。

2018 年 11 月 30 日更新:终于换掉了前面板电缆组件,但问题仍然存在。接下来是电源。

小智 5

很可能是电源开关/LED 电缆套件有问题。我的 ML310 G5 也在做同样的事情,这就是解决问题的方法。显然,这是 HP 的一个已知问题。

459186-001-02 HEWLETT-PACKARD PROLIANT ML310 G5 系统前 LED 至 SYS/BRD 电缆 P/N:459186-001-02 - HEWLETT-PACKARD ORIGINALS


小智 1

机器是否过热?检查风扇和通风口是否有灰尘。