有时,我必须接听支持电话以响应 PC 崩溃并出现蓝屏。如何有效地缩小在该屏幕上提供信息的问题?我必须问用户哪些最重要的问题?
编辑: “诊断”我的意思是,我如何解释蓝屏上的信息以缩小问题的原因?
对于一个项目,我们有 50 台服务器,全部配备(通常)相同的硬件。我们在这里遇到的问题非常严重,并且发生在所有机器上。尽管付出了很多努力并联系了制造商和软件开发人员,但每个人都互相指指点点,甚至拒绝向我提供有关正在发生的事情的线索。
首先让我描述一下设置。这是“服务器级”硬件。对于我的第一次体验,servergrade 是我一生中最大的失望。
在系统上运行 - Windows Server 2012 R2 Enterprise - VMWare Workstation 12 - VM 运行 GPU 密集型任务 - 该系统是库存,根本没有超频/降频
症状 - 随机 BSOD 0x09c(又名 Machine_Check_Exception):有时系统运行一周没有问题,有时仅在 10 分钟后崩溃,但大多数情况下它会运行几个小时。
已经尝试/检查:
最近,我在 Windows 2012 R2 服务器上收到随机 BSOD。它似乎每天发生一次,并且无法确定确切原因。对此的任何帮助将是惊人的!我已经清理了注册表,并更新了所有驱动程序。它似乎是在 9 月 28 日随机开始的,我无法确定当天或前一天对服务器所做的任何事情来保证这种情况发生。这是 memory.dmp 和小型转储。
任何帮助是极大的赞赏!!先感谢您!
https://www.dropbox.com/s/vx50g65favxwn73/MEMORY.DMP?dl=0
https://www.dropbox.com/s/wmzf7d3srgi4dom/100415-40875-01.dmp?dl=0
我有一个 Hyper-V 2012 R2 集群,4 个 Dell PowerEdge R620 服务器通过 FC 连接连接到一个 Dell PowerVault MD3600F 存储阵列;这一切都非常简单,所有服务器都运行 WS2012R2,集群是几个月前新构建的,所有驱动程序和固件都是最新的,Windows 更新到最新的可用补丁(即使是两天前发布的补丁)。还有一个 SCVMM 2012 R2 服务器管理整个事情,但这对于手头的问题似乎并不重要。
这个集群上运行着几个虚拟机;其中一些是运行 Windows Server 2008 R2 的第 1 代 VM,而大多数是运行 Windows Server 2012 R2 的第 2 代 VM;这些也包括最新的可用更新;它们实际上是从集群之后不久构建的模板中部署的,并且会在 Microsoft 发布新补丁时定期更新。
一切都运行良好,但有时(即没有明显的原因或原因)虚拟机将无法启动,出现可怕的INACCESSIBLE_BOOT_DEVICE错误代码而崩溃;这仅在启动(或重新启动)时发生:运行时没有 VM 崩溃。
每当这种情况发生时,就无法让故障虚拟机再次启动;这是两周前第一次发生在虚拟机上,该虚拟机还没有运行任何生产工作负载(它是新部署的);我们非常急于让它工作,因此我们只是刮伤它并部署了一个新的;但是没有找到问题的根本原因。
然后两天前又发生了,当时我们在修补了几个虚拟机后重新启动了它们;其中三个没有重新启动,而其他一些启动没有任何问题。
即使在安全模式下,故障虚拟机也无法启动;但是,当启动到 Windows 恢复环境时(从系统本身,因此从本地(虚拟)磁盘,而不是从 Windows DVD;这意味着确实可以访问虚拟磁盘),一切似乎都正常:启动管理器正确列出在要启动的系统(的输出bcdedit /enum all /v实际上与工作 VM的输出相同),所有卷都可以访问,甚至chkdsk根本没有显示任何错误。唯一的异常是,当运行bootrec /scanos或 时bootrec /rebuildbcd,该工具说它无法找到任何 Windows 安装(尽管 C: 卷在那里并且完全可读)。
这仅发生在 WS2012R2 第 2 代 VM 上(至少到目前为止),因此我假设它是由 EFI …
hyper-v bsod boot windows-server-2012-r2 hyper-v-server-2012-r2
在 Windows Server 2019 上,我有一个 8 驱动器存储空间池,其中包含许多卷,其中只有一个是 ReFS 格式的。(其余的是 NTFS。)
我的服务器最近在一些非常重的 FS 使用(大量大文件删除)中间自发地开始蓝屏循环。现在它在启动期间立即蓝屏,并在各种REFS.SYS错误之间交替。即使启用了安全模式等各种启动选项,也会发生这种情况。同时,构成我的系统卷镜像的其中一个 SSD 出现故障。我认为这意味着系统卷上的某些内容已损坏。然而,根据下一个发现,情况似乎并非如此。
使用新的系统盘,我重新安装了 Windows Server。它检测到所有卷都脱机的存储池。然后我将每一卷都一一上线。所有包含 NTFS 格式分区的卷都可以正常联机。但是,一个包含 ReFS 的卷在联机时会导致新系统蓝屏。
我可以采取哪些步骤来恢复 ReFS 分区/对其运行某种验证或修复?而且,有没有办法让卷在原始系统上离线启动?(我想回到原始服务器映像,因为我知道损坏的不是系统本身。)
最近,我们将 SharePoint 测试服务器更新为 MOSS SP2。这样做后,错误日志中出现了一系列错误,并随机出现蓝屏死机。BSOD 后,将出现以下屏幕:
[尝试附加但不能,因为我是新人]
错误日志条目差异很大。最近的事件 ID 是 10036、7888(相当多)、7 和 63。
7888 错误看起来很安静,经过一些研究,这似乎是一个非常常见的错误。错误消息是“无效的对象名称‘AR_CacheCounters’。”
任何帮助将不胜感激。
提前致谢。
我在运行 VMWare 的虚拟 Windows Server 2008 R2 SP1 服务器时遇到问题。该服务器正在运行 Citrix 并且还安装了 Symantec Endpoint Protection。它随机崩溃并进入 BSOD。
调查事件日志没有产生任何关于崩溃原因的有用信息。我运行了 Windows 调试并生成了如下所示的报告。显然它指向一个失败的驱动程序。问题是我无法确定是什么驱动程序导致了它。我想知道是否有人可以提供一些帮助。
----------
## Bugcheck Analysis ##
SYSTEM_SERVICE_EXCEPTION (3b)
An exception happened while executing a system service routine.
Arguments:
Arg1: 00000000c0000005, Exception code that caused the bugcheck
Arg2: fffff9600008744d, Address of the instruction which caused the bugcheck
Arg3: fffff88007ba3de0, Address of the context record for the exception that caused the bugcheck
Arg4: 0000000000000000, zero.
Debugging Details:
------------------
Page 125923 not present in the dump …Run Code Online (Sandbox Code Playgroud) 有一次在一个蓝色的月亮,我在一个闪亮的新戴尔 R7610 上看到一个蓝屏死机,一个 1100 瓦的戴尔提供的电源在一个强大的 UPS 上。BCode 是 101(未收到时钟中断...),有人说这是由 CPU 电压不足引起的。
当然,我必须联系戴尔支持,他们的自然反应是更换主板、电源或 CPU,或上述组件的组合。
在综合基准测试中,系统内存和 CPU 以及图形内存和 CPU 的表现令人钦佩,持续数小时和数天。
我的问题是:
PS 最近,我经历了与惠普的磨难。他们对这件事很好很专业,但根本原因还没有确定,而且惠普机器仍然低于100%,几个月后我就蓝屏死机一次。
这是快速网络搜索的结果:http : //www.sevenforums.com/bsod-help-support/35427-win-7-clock-interrupt-bsod-101-error.html#post356791
戴尔似乎已通过在 A03 BIOS 中将 PCIe 总线时钟降至 5GT/秒来解决上述问题。我的磁盘控制器支持 PCIe 3.0,这意味着我必须重新验证稳定性。早期测试显示改进。
进一步的测试表明,配备 A03 BIOS 的 Dell R7610 的每个 x16 插槽的性能都显着下降。但现在它运行稳定。
HP 机器在 2013 年 9 月 SUM(7 月 BIOS)中收到了微码更新,使其稳定。
我有一个无法启动的 Hyper-V 虚拟机,蓝屏显示 PAGE_FAULT_IN_NONPAGED_AREA
我可以启动进入 WinPE(恢复),但无法以安全模式启动。
是否可以从 WinPE 运行 DISM,并在已安装的 Windows 映像上执行 restorehealth 命令?
在哪里可以找到有关蓝屏死机 ' STOP' 和其他错误代码的信息的最佳位置?Technet 有一个列表,但它似乎没有STOP我见过的代码:
STOP 0x000000F4 (0x0000000000000003, 0xFFFFFA8070EFFC10,
0xFFFFFA8070EFFE48, 0xFFFFF800002108530)
Run Code Online (Sandbox Code Playgroud)
我真的很喜欢关于 BSOD 的一般资源。还有其他值是什么的任何信息吗?
我有一个 Hyper-v 核心盒,我需要打开自动重启。我怎样才能做到这一点?
BSOD dmp 文件是否包含任何私人信息(密钥、密码等)?它们可以在没有任何脆弱性风险的情况下共享吗?