修复 AMD R9-280X

Ami*_*mit 3 graphics-card

我有一台技嘉 R9-280X,有一段时间了,它在我玩的每款游戏(战地 4、Rust、Minecraft、英雄联盟等)中都显示有缺陷的渲染,通常在天空区域周围。

视频:https : //www.youtube.com/watch?v=19d4SuzUOlk

*这不是游戏特定的问题,因为它发生在多个游戏中。

我已经更新到最新的驱动程序,并降级到旧的,这没有帮助。

我最好的猜测是我的图形内存有缺陷,因此它尝试读取并读取垃圾。

这种情况现在已经超过 6 个月了,并且该卡已过保修期。在扔掉它之前有什么我可以做的吗?

all*_*tic 8

如果您愿意冒险完全破坏卡(超出任何合理的修复希望),您可以尝试某些可能有帮助也可能无济于事的方法。这些补救措施的成功或失败取决于某些事情:

  • 您尝试的补救措施是否能够解决您遇到的特定问题
  • 您正确和准确地执行补救程序的程度,并且没有做任何可能意外造成更多损害的事情
  • 您是否已经成功地猜测或推断出实际问题,并进行了足够的研究来确定最有可能在不造成更大损害的情况下修复它的解决方案

现在,只是为了挑战你认为你知道自己在做什么的想法,并扮演魔鬼的拥护者,我声称你还没有收集到足够的信息来详尽地知道是图形内存(GDDR5)芯片是坏的。

我的主张的理由很简单:

  1. 似乎有某种模式控制着场景的哪些区域最有可能被错误地渲染。
  2. 这种损坏很可能是由于 GPU 内核本身的损坏组件或板上的一些痕迹造成的,因为天空盒渲染可能会调用触发行为的特定类型的 GPU 命令。
  3. 在随机存取存储器中,您玩的每个游戏都不太可能将天空盒的纹理数据存储在同一内存区域中。我想如果他们都使用相同的引擎,这是可能的,但除此之外不太可能。

AMD GPU 以“GIGO”(垃圾输入,垃圾输出)方式设计。这意味着对 GPU 本身几乎没有数据完整性/健全性检查,除了某些低级约束违规会导致 GPU 硬锁定(这可能会在您的计算机上表现为 BSOD 或至少是 TDR)。

在非常高的层次上,GPU 上的绘制调用分为三个“阶段”:

阶段 1:输入- 将命令和随附数据传输到 GPU。损坏或硬件损坏的潜在来源包括损坏的 PCIe 通道、供应给 GPU 的电源不足/故障、从操作系统传输到 GPU 的错误数据(软件/驱动程序错误)等。

阶段 2:处理- GPU 接受它接收到的命令、从 CPU 接收到的数据,并处理它们,将中间结果存储在 VRAM 中。从这一点来看,额外的 GPU 命令可能会导致 GPU 继续越来越多地操作 VRAM 中的数据,甚至数据从 VRAM回 CPU。足够复杂的游戏引擎和/或驱动程序堆栈可能会同时完成这两件事。

在处理阶段,您可能有电路板走线连接电路板的受损区域,导致 GPU 停止正常工作,但不会检测到问题,因此它永远不会锁定或崩溃。或者由于压力或热量,GPU 中的实际晶体管可能会退化。

阶段 3:输出- GPU 获取“完成的”图形数据,将它们合成在一起(有点像将各个部分组装成一个谜题,或者将不同颜色的薄膜相互叠加),然后将其写出到帧缓冲区(由显示控制器读取,然后将其推送到 HDMI/VGA/DVI/DP 端口)。或者,它可能会在此阶段读回 CPU,然后使用软件写回帧缓冲区。取决于具体使用的驱动程序/引擎架构。

如果您的桌面在不玩游戏时正常工作,那么您的问题不太可能出现在输出阶段,因为与帧缓冲区或显示控制器相关的任何内容都可能会出现,无论您在做什么类型的渲染。

如果我不得不猜测,我会说 VRAM 不是一个很可能的嫌疑人,而是 GPU 的某些特定的固定功能区域,负责处理天空盒或遮挡剔除或其他东西,已损坏或跟踪去它被损坏。

也就是说,您可以尝试几种解决方案,从安全到危险到极有可能破坏您的卡片:

  1. 最安全- 进入 AMD 催化剂控制中心。在 AMD Overdrive 下,降低 GPU 的频率。首先将其降频一点,然后降低很多。这是完全安全的,并且保证不会损坏您的 GPU,因为它在空闲时会自动以“降频”速度运行,无论如何。有时问题仅在 GPU 处于重负载下时才会出现。如果你的问题是这样的,这将通过在任何给定时间减少 GPU 上的负载(并减少热量)来解决它。不过,你会得到较低的 FPS。

  2. 最安全- 尝试其他操作系统,如 GNU/Linux(例如 Ubuntu),看看问题是否在那里出现。如果不是,则 GNU/Linux 驱动程序实现可能会影响 GPU 不受损坏影响的区域/功能,或者它可能一直是软件问题,根本没有任何硬件缺陷。

  3. 安全- 尝试以物理方式清洁 GPU 和 PCI Express 插槽。不要使用任何腐蚀性化学品。轻轻擦拭卡上与 PCI Express 插槽接口的引脚。

  4. 轻微风险- 尝试更新 GPU 的固件代码。有一些网站为 AMD 和 Nvidia 显卡托管了各种版本的 VGA BIOS。确保匹配准确的模型。然后比较版本。如果您没有安装最新版本,请获取最新版本。在大多数情况下,您可以使用库存的 AMD flasher 实用程序安全地对其进行闪存。如果您下载了错误的 ROM,您可能会损坏您的卡,但这在 R9 280X 上不太可能,因为您始终可以翻转板上的双 ROM 开关(一个小开关,可以让您拥有两个独立版本的 ROM /BIOS/firmware 立即安装)以返回出厂固件。只要确保不要破坏工厂固件的第二个副本,否则你真的死在水里了。

但总的来说,刷新固件所带来的风险很小,尤其是在双 BIOS 卡上。即使您在闪烁时断电,您只需拨动开关即可恢复出厂状态,然后继续前进。我个人已经刷了大约 10 次 HD7970/R9 280X。与我必须建议的其他内容相比,这真的很随意。


除了我的回答中的这一点之外,我只想强调这是多么危险,并且我不对您因尝试此操作而对硬件造成的任何损坏承担任何责任。不正确地执行此操作很可能会导致您的卡完全变砖。

  1. 超级危险- 尝试烘焙您的 GPU。只需谷歌“烘焙 GPU”,您就会获得数百个用户故事,其中一些是快乐的,但最悲伤的是,说明了四种结果之一:永久修复了问题,暂时修复了问题,没有修复了问题但没有损坏GPU 进一步,或打破了 GPU。一个非常重要的部分谁试试这个报告,它打破了GPU的人。这可能是由于他们处理不当造成的,但事实仍然是,这是非常危险的。如果您不小心,您也可能会在热的材料上烫伤手,如果您鲁莽,甚至会引起火灾。

这里的一般概念是你想要一个热烤炉(不是微波炉 - 非常重要!)并迅速让你的 GPU 达到足够高的温度,使焊料有点融化。这会“回流”焊料并可能修复某些类型的损坏。它不是万能的,它可以(并且经常)完全破坏卡片。它对时间和温度非常敏感,不适合胆小的人。

  1. 超级困难和危险- 物理上可以更换或升级显卡上的 VRAM。是演示该过程的 Youtube 视频。但是,以下限制会立即出现:

    • 您需要正确的工具和正确的双手物理控制才能做到这一点而不会破坏任何东西。
    • 您需要知道可与您的 GPU 配合使用的兼容 GDDR 芯片的确切部件号。了解如何找到正确的部分超出了此问题/答案的范围。
    • 完成后,您需要能够将所有东西重新组合在一起,而且不会损坏任何东西。

当然,如果您的 GDDR 一开始没有损坏/有缺陷,则此解决方案没有任何意义。不幸的是,它不是很容易确定是否问题出与GDDR或其他地方。您也许可以编写一些等效于 memtest86 的软件,但对于 GPU 而言,但我从未听说过这样的事情。

当然,最后一个:

  1. 超级危险-认识一位显卡硬件工程师的 AMD 员工。:) 他们可能在进行开发/测试/验证时一直在修复这样的东西。这是非常危险的,因为即使你是这个人的朋友,要求他们为你做这件事很可能会导致他们对你大喊大叫或打你。:)