我们的新服务器已经运行了几个月基本正常。然而,它两次无缘无故地自行关闭。
最近一次发生在几天前的晚上 11 点 41 分。事件日志没有显示任何不妥之处,最后一个条目是安全日志中相当普通的审计条目。UPS 日志显示没有电源问题。没有什么特别的东西在运行,因为它是在几个小时之后。当然除了晚上 10 点开始的夜间备份。备份日志也没有显示任何有趣的内容,只是在备份过程中停止。尽管服务器配置为写入内核转储并重新启动,但没有内存转储并且系统没有重新启动。它是 HP Proliant ML330 G6 系列服务器。
第二天早上手动重新启动服务器时,记录了以下事件:
Log Name: System
Source: EventLog
Date: 4/16/2011 8:20:22 AM
Event ID: 6008
Task Category: None
Level: Error
Keywords: Classic
User: N/A
Computer: XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description:
The previous system shutdown at 11:41:26 PM on ?4/?15/?2011 was unexpected.
Run Code Online (Sandbox Code Playgroud)
和
Log Name: System
Source: Microsoft-Windows-Kernel-Power
Date: 4/16/2011 8:20:00 AM
Event ID: 41
Task Category: (63)
Level: Critical
Keywords: (2)
User: SYSTEM
Computer: XXXXXXXX.xxxxxxxxxxxxxxxx.local
Description:
The system has rebooted without …Run Code Online (Sandbox Code Playgroud) 我的服务器出现错误:“iLO 自检报告问题:嵌入式闪存/SD-CARD”“嵌入式媒体管理器初始化失败”
HPE 建议如下:https : //support.hpe.com/hpsc/doc/public/display? docId = emr_na-c04996097
我现在已经到了所有步骤的步骤,更换系统板。但我想知道如果我不更换董事会会有什么影响。我不使用 SD 卡。我不确定 NAND 实际用于什么以及它存储什么,而且如果我不解决这个问题,我会有什么风险?
我认为可能是 iLO 的日志丢失,甚至 iLO 的设置丢失?
编辑,现在几个月后,服务器仍然不在保修期内,甚至发现更多类似的 NAND 问题都属于此HPE 咨询保护伞。使用RESTful 接口工具解决了烦人的问题,手动支持 AC 电源移除部分。但遗憾的是,我仍然无法解决所有问题。虽然我看到了一些信息,在这个线程中,在线等。我无法从 HPE 找到任何确凿的信息,对于此类 NAND 问题有何影响。
昨天 RAID5 阵列中的 SAS 磁盘出现故障,我正准备更换它,但是我注意到前机箱与其余磁盘不匹配。该阵列由 300GB 10K SAS 磁盘和左侧机箱组成。我找到了一个 300GB 10K SAS 磁盘和正确的机箱。在打开密封包装之前,这些可以互换吗?
我认为服务器是 HP Proliant DL360 G8(目前不在现场)。
在下面的屏幕截图中,我对 3 台机器、4 个驱动器进行了基准测试。我的主要生产基于DL580,HPE 1.92TB SATA 6G 混合使用 SFF SSD RAID 1。
MySQL 100 万行的插入时间在 SSD 中约为 30 秒,而在 ImageServer 20TB 7200 RPM RAID 5 中约为 15 秒!!这他妈的怎么可能?
SSD花了我~2300美元,我真的很震惊,所有固件和驱动程序都是最新的,操作系统是Windows 2012 R2。
这是已知的还是预期的?!如果没有,那么请分享您的见解。
3台机器的详细信息:
的HP ProLiant DL380 Gen9,智能阵列P840,20TB RAID 5体积:12×2 TB 7200 RPM(驱动器类型:SAS HDD,型号:HP MB2000FCWDF,固件版本:HPD9,传输速度:PHY 1:6 Gbps)的。
HP ProLiant DL380 Gen9、Smart Array P440ar、~1TB RAID 5 卷:4 X 300 GB 10500 RPM(驱动器类型:SAS 硬盘,型号:HP EG0300FCVBF,固件版本:HPD9,传输速度:PHY 1:6 Gbps)。
HP ProLiant DL580 Gen9、Smart Array P830i、1.9TB …
我刚刚打开了一个全新的 HP(我猜现在是 HPE)ProLiant ML10 v2 塔式服务器系统 i3-4150 3.5 GHz。按下并释放电源按钮一次,它按预期响应,但在我等待它完成其早期初始化序列(达到 20%)20 分钟后,系统没有响应。现在它根本不会响应按下和释放(也不按住)开机按钮。
我有用户指南和故障排除指南第1和第2卷。这些文件都没有解决这个问题。
除了开机/待机按钮和系统电源 LED 以 1 Hz 的频率闪烁绿色外,我的服务器 LED 目前全黑。在我尝试使用文档和网络搜索找到此问题的解决方案时,它已处于这种情况 2 个多小时。我第一次打开它时,这个 LED 也在闪烁,在我按下并释放按钮后它变成了稳定的绿色,因为服务器似乎正常启动,将典型的启动序列输出文本发送到连接的显示器。因此,根据我迄今为止的经验,此表中的“绿色闪烁(每秒 1 赫兹/周期)= 执行开机顺序”这一行似乎具有误导性。
我会打电话给 HPE,只是今天是星期六,而且我没有服务合同。任何人都可以提供有关这里发生的事情以及如何解决的见解吗?
我们有一台保修期外的测试机 (HP DL360 G9),我们一直在使用,但不想修理。运行状况 LED 亮起,这导致优秀的数据中心人员代表我们进来并吓坏了。好人。有没有办法“确认”健康灯,这样我们就可以让我们出色的数据中心人员每次经过我们的机架时都不会认为天要塌下来?
hpe ×7
hp-proliant ×3
hardware ×2
ilo ×2
datacenter ×1
hp ×1
pci-express ×1
performance ×1
raid ×1
raid5 ×1
sas ×1
ssd ×1