我有一个新的HP ProLiant DL360 G7系统,它出现了一个难以重现的问题。服务器在POST 过程中随机挂在“正在进行电源和热校准... ”屏幕上。这通常在从已安装的操作系统进行热启动/重新启动之后。
系统在这一点上无限期地停止。通过 ILO 3 电源控制发出复位或冷启动,可使系统正常启动而不会发生事故。
当系统处于此状态时,ILO 3 界面完全可访问且所有系统健康指标均正常(全部为绿色)。服务器位于气候控制的数据中心内,电源连接到 PDU。环境温度为 64°F/17°C。该系统在部署之前被置于一个 24 小时的组件测试循环中,没有出现故障。
该服务器的主要操作系统是 VMWare ESXi 5。我们最初尝试了 5.0,后来又尝试了 5.1 版本。两者都是通过 PXE 引导和 kickstart 部署的。此外,我们正在测试裸机 Windows 和 Red Hat Linux 安装。
HP ProLiant 系统具有一套全面的 BIOS 选项。除了静态高性能配置文件之外,我们还尝试了默认设置。我已经禁用了启动启动画面,只是在那个点上有一个闪烁的光标,而不是上面的屏幕截图。我们还为 BIOS配置尝试了一些 VMWare “最佳实践”。我们已经看到来自 HP的建议,它似乎概述了一个类似的问题,但没有解决我们的具体问题。
怀疑是硬件问题,我让供应商发送了一个相同的系统,以便当天交货。除了磁盘之外,新服务器是完全相同的构建。我们将磁盘从旧服务器移动到新服务器。我们在更换硬件上遇到了同样的随机启动问题。
我现在让两台服务器并行运行。该问题在热靴上随机出现。冷靴似乎没有问题。我正在研究一些更深奥的 BIOS 设置,例如禁用 Turbo Boost 或完全禁用电源校准功能。我可以尝试这些,但它们不是必需的。
有什么想法吗?
- 编辑 -
系统详情:
我有一台用作工作站的 HP ProLiant DL370 G6 服务器。在使用独立的 Radeon HD6xxx GPU 发布屏幕之前,重新启动和冷启动需要 60 秒。我该怎么做才能让它启动得更快?
我有机会使用 HP Gen8 服务器。它快速发布并显示各种 CPU/内存/QPI 初始化步骤。仍然需要很长时间,但至少我可以看到发生了什么。
我的 HP DL 380 G6 一直出现奇怪的间歇性问题。这一切都始于大约一年前,当时它正在制作中。晚上 10 点我接到电话说出现了问题,我跌跌撞撞地来到数据中心,发现这台服务器处于启动循环中,不停地闪烁。通过将其分解为最低配置、咒骂和运气,我终于得到了启动的东西。我说后者是因为从那以后它就不一致了。
从那天晚上起,它就成为我测试环境的一部分。它运行了好几个月,然后我只是因为不需要它而将其关闭。现在我想重新打开它,问题又回来了。我尝试过以下方法:
iLO 在这种状态下似乎无法正常工作,当我能够恢复正常工作时,没有记录任何故障。按下时,UID 指示灯不会响应,除非首次插入。几乎就像通电几秒钟后故障就会出现一样。过去,当它打开时,经过彻底的刺激后,它突然打开,但没有触摸电源按钮。
有人见过这样的事情吗?这台机器注定会用一只琥珀色的眼睛凝视着遗忘吗?我是否应该接受这样的事实:尝试重新启动一台已有 6 年历史的服务器,而该服务器现在在 eBay 上的价格低于 200 美元,也许不值得?我是否用我的冒犯性且过时的诽谤使其陷入了无法运作的状态?我是否会遇到一些简短的问题?时间会证明一切。