VMWare ESXi 4.1 中的随机和选择性 ARP 盲目性

Pet*_*ace 6 networking centos arp vmware-esxi

我们有多个 VMWare ESX 服务器分布在我们公司中,执行各种任务。一台特定的 ESXi 主机表现出非常奇怪的行为。当我们的监控系统 (Orion) 通知我们它无法再 ping 盒子时,我们就会检测到它。

在跳转到相关访客的本地控制台后,我们看到它无法 ping 任何不在其 ARP 表中的新地址。

起初我们认为问题只是与我们的一位客人有关,因为问题似乎总是发生在另一位客人DevRedis 身上。然而,今天下午问题交换并开始发生在ApacheBox而不是DevRedis 上。

当我有幸发现问题时,我在连接的两端(一侧是 vmware,另一侧是物理网络服务器)运行了 tcpdump,并注意到以下事件过程:

  1. 来宾ApacheBox向服务器WindowsBeast的物理地址发送 ARP 请求
  2. WindowsBeast向网络提交一个 ARP is-at,指示其物理 mac 地址。
  3. ApacheBox永远不会看到 ARP is-at 响应。

有问题的 ESX 主机正在运行VMware ESXi、4.1.0、348481

两个来宾(DevRedisApacheBox)都运行 CentOS 6.3,但是它们运行两个单独的内核版本(2.6.32-279.9.1.el6.x86_642.6.32-279.el6.x86_64)所以我不是完全确定这是一个 CentOS 问题。

有没有人对可能导致这种情况的原因有任何想法?有没有人遇到过它?