eth0 NIC Link is Down 在内核日志中重复消息

Mil*_*vić 14 networking ethernet nic linux-networking

我从几天前就注意到出现了相同的重复消息,我可以肯定地说,在那段时间没有故意更改(安装/卸载)任何内容。

这是/var/log/kern.log消息的示例:

Mar 30 06:32:45 aurora kernel: [566322.867110] e1000e: eth0 NIC Link is Down

Mar 30 06:32:47 aurora kernel: [566325.313634] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

Mar 30 06:32:59 aurora kernel: [566337.632930] e1000e: eth0 NIC Link is Down

Mar 30 06:33:18 aurora kernel: [566356.543664] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None

Mar 30 11:05:47 aurora kernel: [582689.779752] e1000e: eth0 NIC Link is Down

Mar 30 11:05:50 aurora kernel: [582692.174337] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx
Run Code Online (Sandbox Code Playgroud)

从完整的日志文件中 - 当将所有此类日志消息计算在内时 - 我可以得出结论:

  • eth0 每隔几个小时就会失败
  • eth0 在第一种情况下失败了两次,在第二种情况下失败了 19 秒

这是我在这里谈论的生产服务器。

如何解决这个问题,因为邮件服务器正在生产中,我不能容忍持续 19 秒的网络故障?

Mic*_*nez 10

  1. 检查线路上的错误,查看ifconfig. 如果非零,则硬件(电缆、NIC 卡或集线器/交换机)存在问题。不可靠的以太网电缆也会在该领域出现错误。
  2. 更换以太网电缆,无论第 1 步如何。这快速、便宜且简单,并且应该在您的链接以随机间隔上下移动时进行。
  3. 使用ethtool并确保网络设置(双工等)与交换机上的设置相匹配。如果您不是交换机的管理员,请让网络管理员为您提供设置。
  4. 如果交换机启用了流量控制,那么请确保它在您的 Linux 机器上启用。否则,禁用它。

作为旁注,您应该评估是否需要流量控制。根据惠普的说法,只有高性能应用程序才需要:请参阅惠普关于何时使用流量控制的文章

  • 这是线路错误。在我报告错误后,服务器场技术人员完成了这项工作。 (2认同)