PCIe 总线错误快速填充日志

icr*_*crf 5 logs nvidia linux-mint

我的系统出了点问题,这个错误以每秒几千次的速度出现在 syslog 和 kern.log 中。它被列为已更正的事实让我认为它是短暂的并且没有任何问题,但它以如此淫秽的频率出现在根目录中这一事实是有问题的(你见过 250+ GB 的 kern.log 吗?)。

pcieport 0000:00:03.0: PCIe Bus Error: severity=Corrected, type=Physical Layer, id=0018(Receiver ID)
pcieport 0000:00:03.0:   device [8086:2f08] error status/mask=00000001/00002000
pcieport 0000:00:03.0:    [ 0] Receiver Error         (First)
pcieport 0000:00:03.0: AER: Multiple Corrected error received: id=0018
Run Code Online (Sandbox Code Playgroud)

有时,还有另一句台词can't find device of ID0018混杂在一起。除了这些填满 root 的日志条目之外,没有其他症状。对于我使用它进行的最小浏览/视频播放/编码,系统表现良好。使用 nvidia-343 驱动程序通过 HDMI 将图形输出到 4k 显示器。

我只能从中看出“设备 [8086:2f08]”是 CPU 之外的根 PCIe 集线器之一。GPU 是我唯一插入的 PCIe 设备,但我不知道主板上的任何板载功能是否也可能不在 PCIe 总线上。

系统信息:

mnemosyne ~ # inxi -Fxz
System:    Host: mnemosyne Kernel: 3.13.0-24-generic x86_64 (64 bit, gcc: 4.8.2) Console: tty 5 Distro: Linux Mint 17 Qiana
Machine:   System: ASUS product: All Series
           Mobo: ASUSTeK model: X99-A version: Rev 1.xx Bios: American Megatrends version: 0216 date: 08/29/2014
CPU:       Hexa core Intel Core i7-5820K CPU (-HT-MCP-) cache: 15360 KB flags: (lm nx sse sse2 sse3 sse4_1 sse4_2 ssse3 vmx) bmips: 40398.7
           Clock Speeds: 1: 1200.00 MHz 2: 1200.00 MHz 3: 1200.00 MHz 4: 3301.00 MHz 5: 1200.00 MHz 6: 1200.00 MHz 7: 3301.00 MHz 8: 1200.00 MHz 9: 1200.00 MHz 10: 1200.00 MHz 11: 1200.00 MHz 12: 1200.00 MHz
Graphics:  Card: NVIDIA GM107 [GeForce GTX 750] bus-ID: 01:00.0
           X.org: 1.15.1 drivers: nvidia (unloaded: fbdev,vesa,nouveau) tty size: 175x51 Advanced Data: N/A out of X
Audio:     Card: NVIDIA Device 0fbc driver: snd_hda_intel bus-ID: 01:00.1 Sound: ALSA ver: k3.13.0-24-generic
Network:   Card: Intel Ethernet Connection (2) I218-V driver: e1000e ver: 2.3.2-k port: f020 bus-ID: 00:19.0
           IF: eth0 state: up speed: 1000 Mbps duplex: full mac: <filter>
Drives:    HDD Total Size: 36519.2GB (13.7% used) 1: id: /dev/sda model: WDC_WD60EFRX size: 6001.2GB
           2: id: /dev/sdb model: WDC_WD60EFRX size: 6001.2GB 3: id: /dev/sdc model: WDC_WD60EFRX size: 6001.2GB
           4: id: /dev/sdd model: WDC_WD60EFRX size: 6001.2GB 5: id: /dev/sde model: Crucial_CT512MX1 size: 512.1GB
           6: id: /dev/sdf model: WDC_WD60EFRX size: 6001.2GB 7: id: /dev/sdg model: WDC_WD60EFRX size: 6001.2GB
Partition: ID: / size: 454G used: 342G (80%) fs: ext4 ID: swap-1 size: 17.08GB used: 0.93GB (5%) fs: swap
RAID:      No RAID devices detected - /proc/mdstat and md_mod kernel raid module present
Sensors:   System Temperatures: cpu: 32.0C mobo: N/A
           Fan Speeds (in rpm): cpu: N/A
Info:      Processes: 318 Uptime: 9 days Memory: 4353.6/15950.5MB Runlevel: 2 Gcc sys: 4.8.2 Client: Shell inxi: 1.8.4
Run Code Online (Sandbox Code Playgroud)

关于可能导致这种情况的任何建议,或缩小选项范围的任何方法,将不胜感激。这是我拥有的所有计算机硬件,因此交换部件不是一种选择。

小智 5

您可以使用以下命令确定连接到此根端口的设备

lspci -v -s 3.0 | grep Bus:
Run Code Online (Sandbox Code Playgroud)

你应该看到这样的一行:

Bus: primary=00, secondary=04, subordinate=04, sec-latency=0
Run Code Online (Sandbox Code Playgroud)

次要和从属通常是相同的,因此您可以使用该命令

lspci -s 4:0
Run Code Online (Sandbox Code Playgroud)

查看该总线上有哪些设备。对于我这里的系统,它看起来像这样:

lspci -v -s 4:0            
04:00.0 SATA 控制器:Marvell Technology Group Ltd. 88SE9123 PCIe SATA 6.0 Gb/s 控制器(修订版 11)
04:00.1 IDE 接口:Marvell Technology Group Ltd. 88SE912x IDE 控制器(修订版 11)