我看到如下错误消息:
Nov 15 15:49:52 x99 kernel: pcieport 0000:00:03.0: AER: Multiple
Corrected error received: id=0018 Nov 15 15:49:52 x99 kernel: pcieport
0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Data Link Layer,
id=0018(Receiver ID) Nov 15 15:49:52 x99 kernel: pcieport 0000:00:03.0:
device [8086:6f08] error status/mask=00000040/00002000 Nov 15 15:49:52
x99 kernel: pcieport 0000:00:03.0: [ 6] Bad TLP
Run Code Online (Sandbox Code Playgroud)
即使它们(到目前为止)已经得到纠正,这些也会导致性能下降。显然,这个问题需要解决。但是,我在互联网上找不到太多关于它的信息。(也许我找错了地方。)我只找到了几个链接,我将在下面发布。
有谁知道更多关于这些错误的信息?
是主板、三星 950 Pro 还是 GPU(或这些的某种组合)?
硬件是:M2 中的 Asus X99 Deluxe II Samsung 950 Pro NVMe。mb 上的插槽(共享 PCIe 端口 3)。没有其他东西插入 PCIe 端口 3。PCIe 插槽中的 GeForce GTX 1070 1 Core i7 6850K CPU
我发现的几个链接提到了相同的硬件(X99 Deluxe II mb 和 Samsung950 Pro)。我正在运行 Arch Linux。
到目前为止,我在 journalctl 或其他任何我想搜索的地方都没有找到字符串“8086:6f08”。
nvme ssd 的奇怪错误消息(Bad TLP):linuxquestions https://www.reddit.com/r/linuxquestions/comments/4walnu/odd_error_message_with_nvme_ssd_bad_tlp/
PCIe:您的卡是否在默默地挣扎于 TLP 重传?http://billauer.co.il/blog/2011/07/pcie-tlp-dllp-retransmit-data-link-layer-error/
GTX 1080 抛出错误的 TLP PCIe 总线错误 - GeForce 论坛https://forums.geforce.com/default/topic/957456/gtx-1080-throwing-bad-tlp-pcie-bus-errors/
驱动程序 - dmesg 日志中的 PCIe 错误 - 问 Ubuntu https://askubuntu.com/questions/643952/pcie-error-in-dmesg-log
780Ti X99 硬锁 - PCIE 错误 - NVIDIA 开发者论坛 https://devtalk.nvidia.com/default/topic/779994/linux/780ti-x99-hard-lock-pcie-errors/
dir*_*rkt 40
我至少可以提供一些细节,即使我无法完全解释会发生什么。
如对实施例描述这里,与PCIe总线控制器的CPU进行通信由事务层数据包(TLP的)。硬件检测何时有故障,Linux 内核将其报告为消息。
内核选项pci=nommconf
禁用内存映射 PCI 配置空间,从内核 2.6 开始,它在 Linux 中可用。大致来说,所有的PCI设备有一个描述这个设备(您看到的面积lspci -vv
),和原来的方法来访问这个区域包括通过I / O端口去,而PCIe让这个空间被映射到内存中以便简单访问。
在这种特殊情况下的手段,什么时候的PCIe控制器使用此方法访问特定设备的configuraton空间出错。这可能是设备中的硬件错误,主板上的 PCIe 根控制器中,这两者的特定交互中,或其他原因。
通过使用pci=nommconf
,所有设备的配置空间都会以原来的方式访问,改变访问方式可以解决这个问题。因此,如果您愿意,它既可以解决又可以抑制它。
添加内核命令行选项pci=nommconf
为我解决了这个问题。因此,我假设问题与主板有关。它发生在我所有配备 X99 主板的计算机上。它不会发生在 Z170 系统或我拥有的任何其他硬件上。
小智 6
我收到相同的错误(与设备 8086:6f08 相关的错误 TLP)。我有 X99 Deluxe II、三星 960 pro、Nvidia 1080 ti。这些问题似乎与 X99 芯片组和 M.2 设备有关,例如 Samsung Pro。
X99 Deluxe II 主板在 PCIE16_3 插槽和 M.2/U.2 之间共享带宽。根据@Nic 的评论,在 BIOS 中我更改了板载设备配置 | U.2_2 带宽从 Auto 到 U.2_2。这为我解决了问题。