Gan*_*Yin 3 boot pci-express power-supply graphics-card
公司的一台PC机有3个16x pci-e插槽,我们称它们为ABC(A离CPU最近,C最远)。里面安装了两块显卡(A中的gtx680和C中的gtx560,都用于某种gpu计算)并且都运行良好。
然后新的pci-e卡是我们自己开发的,用来从外界获取一些数据。
那么问题来了,如果三个槽都用了(在B中安装新卡),大多数情况下PC会无法启动(PC偶尔可以启动时OS无法识别新卡)。
然后我们做了一些实验:
如果我们在 A 中移除显卡,PC 将毫无问题地启动,新卡在 A 或 B 中都可以正常工作。
如果我们移除新卡并在B中安装gtx680,PC也会启动(通过观察键盘状态和HD活动指示灯),但没有显示,可能需要一些配置。
如果我们在A中安装新卡,在B中安装gtx680,PC也无法启动。
那么,问题的可能原因是什么?我需要做更多的研究吗?关于什么?
我希望我已经让自己理解,任何建议将不胜感激。
编辑:
我们使用的 PSU 标记为 1000W,而且,当我们使用两个 gpu 配置时,当某些 cuda 应用程序完全使用 680 时,PC 可以正常工作一整天而没有任何问题。
编辑2:
我们开发的显卡可以在其他只有板载显卡的普通电脑(联想或戴尔)上工作。问题机不是dell、lenovo等知名品牌,主板标有EVGA。
无耻地抄袭了Chris S对 Server Fault 上有关 PCI-e 规范的类似问题的出色回答:
应该是什么:PCIe 规范规定所有插槽都从 1x 开始并计算它们可以使用的通道数。谁拥有更多并不重要,有些插槽设计用于容纳较大的卡片,而较小的卡片则适合较大的插槽。无论双方通信的最高速度是多少(通道数和时钟/版本),这就是将要协商和使用的速度。
真实情况:通常应该发生的就是实际发生的。但是有很多板(尤其是发烧友板)不符合规范。有些主板在它们的第一个 PCIe 插槽中只使用 16x 视频卡。其他人将无法正确自动协商。在服务器级硬件中,这些问题非常罕见,但确实会发生。
基本上,很多主板都没有完全遵循 PCI-e 规范。我遇到了 8x RAID 控制器的问题。这个特殊的台式机主板只有一个 PCI-e x16 插槽,其余都是 x4 或 x1;所以我唯一的选择是 x16 插槽。但是主板只接受那个插槽中的显卡,所以我们最终不得不用更高端的主板替换那个主板。
现在,您没有提到该硬件在何处运行。如果它在名牌服务器上运行,或者具有通用服务器级主板(考虑 Super Micro、Tyan 等),那么这可能不是您的问题。
但是如果这是在 Gigabyte 或 Asus 主板(或类似的)上运行,那么我建议简单地尝试另一个主板,因为它完全有可能只允许 x16 插槽中的显卡,或者只接受一些奇怪的图形/其他组合插槽中的卡片。