对于一个项目,我们有 50 台服务器,全部配备(通常)相同的硬件。我们在这里遇到的问题非常严重,并且发生在所有机器上。尽管付出了很多努力并联系了制造商和软件开发人员,但每个人都互相指指点点,甚至拒绝向我提供有关正在发生的事情的线索。
首先让我描述一下设置。这是“服务器级”硬件。对于我的第一次体验,servergrade 是我一生中最大的失望。
在系统上运行 - Windows Server 2012 R2 Enterprise - VMWare Workstation 12 - VM 运行 GPU 密集型任务 - 该系统是库存,根本没有超频/降频
症状 - 随机 BSOD 0x09c(又名 Machine_Check_Exception):有时系统运行一周没有问题,有时仅在 10 分钟后崩溃,但大多数情况下它会运行几个小时。
已经尝试/检查: