在假期周末,我们的一位客户遭遇停电。当一切都恢复在线时,大多数设备似乎都正常,但少数设备(我们的 ESXi 主机之一和多个 VDI)无法获得正确的 IP 地址。他们从 Windows 获得了 169 APIPA。我查看了 DHCP 日志,从停电开始,有 0 次租用或续订。就像 DHCP 整个周末都处于空闲状态。
我退回了它,突然之间,所有的租约都开始涌入,所有获得 APIPA 的东西都得到了一个正常的地址,一切都恢复了正常。
我的问题是:DHCP 是否有某种设置导致它像这样运行?我觉得硬中断不应该破坏 DHCP,尤其是在重新启动时。
我想弄清楚发生了什么,这样如果再次发生中断,我们就不会遇到同样的问题。
日志时间轴:
11/25 11:15 PM,服务器断电后启动:
00,11/25/20,23:12:23,Started,,,,,0,6,,,,,,,,,0
64,11/25/20,23:12:23,No static IP address bound to DHCP server,,,,,0,6,,,,,,,,,0
Run Code Online (Sandbox Code Playgroud)
大约一个小时后,设备开始丢失地址:
24,11/26/20,00:00:19,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
18,11/26/20,00:00:19,Expired,10.x.x.16,,,,0,6,,,,,,,,,0
18,11/26/20,00:00:19,Expired,10.x.x.18,,,,0,6,,,,,,,,,0
18,11/26/20,00:00:19,Expired,10.x.x.19,,,,0,6,,,,,,,,,0
etc...
Run Code Online (Sandbox Code Playgroud)
几个小时后,条目开始被删除
24,11/26/20,03:12:24,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
16,11/26/20,03:12:24,Deleted,10.x.x.16,,,,0,6,,,,,,,,,0
16,11/26/20,03:12:24,Deleted,10.x.x.18,,,,0,6,,,,,,,,,0
16,11/26/20,03:12:24,Deleted,10.x.x.19,,,,0,6,,,,,,,,,0
etc...
Run Code Online (Sandbox Code Playgroud)
之后,在数据库清理之外没有任何活动:
24,11/26/20,21:12:29,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
25,11/26/20,21:12:29,0 leases expired and 0 leases deleted,,,,,0,6,,,,,,,,,0
25,11/26/20,21:12:29,0 leases expired and 0 leases deleted,,,,,0,6,,,,,,,,,0
24,11/26/20,22:12:29,Database Cleanup Begin,,,,,0,6,,,,,,,,,0
etc... (until reboot)
Run Code Online (Sandbox Code Playgroud)
今天,当我重新启动时,一切都再次开始获取地址
01,11/30/20,05:17:21,Stopped,,,,,0,6,,,,,,,,,0
00,11/30/20,05:17:26,Started,,,,,0,6,,,,,,,,,0
55,11/30/20,05:17:26,Authorized(servicing),,<redacted>.net,,,0,6,,,,,,,,,0 …Run Code Online (Sandbox Code Playgroud)