30 分钟后 IPv6 默认路由丢失

dod*_*ron 5 ipv6 firewall networking

我有一个 ubuntu 16.04(内核 4.7.3)系统,它在收到的第一个 RA 过期(30 分钟)后丢失了 IPv6 默认路由。

下面是系统启动时路由表的样子:

# ip -6 route
2001:xxxx:xxxx:xxxx::/64 dev ens192  proto kernel  metric 256  mtu 1480 pref medium
fe80::/64 dev ens192  proto kernel  metric 256  mtu 1480 pref medium
default via fe80::ce46:d6ff:feb0:f6b1 dev ens192  proto ra  metric 1024  expires 1747sec mtu 1480 hoplimit 64 pref high
Run Code Online (Sandbox Code Playgroud)

30分钟后,我看到了这个:

# ip -6 route
2001:xxxx:xxxx:xxxx::/64 dev ens192  proto kernel  metric 256  mtu 1480 pref medium
fe80::/64 dev ens192  proto kernel  metric 256  mtu 1480 pref medium
default via fe80::ce46:d6ff:feb0:f6b1 dev ens192  proto ra  metric 1024  expires -8sec mtu 1480 hoplimit 64 pref high
Run Code Online (Sandbox Code Playgroud)

然后,几秒钟后,我看到了这个:

# ip -6 route
2001:xxxx:xxxx:xxxx::/64 dev ens192  proto kernel  metric 256  mtu 1480 pref medium
fe80::/64 dev ens192  proto kernel  metric 256  mtu 1480 pref medium
Run Code Online (Sandbox Code Playgroud)

tcpdump 显示系统正在接收 RA:

#tcpdump -vv ip6
tcpdump: listening on ens192, link-type EN10MB (Ethernet), capture size 262144 bytes
15:34:21.842483 IP6 (class 0xe0, hlim 255, next-header ICMPv6 (58) payload length: 96) fe80::ce46:d6ff:feb0:f6b1 > ip6-allnodes: [icmp6 sum ok] ICMP6, router advertisement, length 96
        hop limit 64, Flags [none], pref high, router lifetime 1800s, reachable time 0s, retrans time 0s
          source link-address option (1), length 8 (1): cc:46:d6:b0:f6:b1
            0x0000:  cc46 d6b0 f6b1
          advertisement interval option (7), length 8 (1):  30000ms
            0x0000:  0000 0000 7530
          mtu option (5), length 8 (1):  1480
            0x0000:  0000 0000 05c8
          rdnss option (25), length 24 (3):  lifetime 60s, addr: ordns.he.net
            0x0000:  8075 0000 003c 2001 0470 0020 0000 0000
            0x0010:  0000 0000 0002
          prefix info option (3), length 32 (4): 2001:xxxx:xxxx:xxxx::/64, Flags [onlink, auto], valid time 2592000s, pref. time 604800s
            0x0000:  40c0 0027 8d00 0009 3a80 0000 0000 2001
            0x0010:  XXXX XXXX XXXX 0000 0000 0000 0000
Run Code Online (Sandbox Code Playgroud)

所以我假设,由于 tcpdump 看到了 RA,防火墙必须丢弃 RA(我使用 UFW 来管理 iptables)。

所以我禁用了 ufw 并等到我在 tcpdump 中看到另一个 RA。仍然没有默认路由。

这是怎么回事?我错过了一些简单的东西吗?

编辑:

在对系统进行更多研究之后......看起来网络服务无法在启动时启动。

# systemctl status networking
? networking.service - Raise network interfaces
   Loaded: loaded (/lib/systemd/system/networking.service; enabled; vendor preset: enabled)
  Drop-In: /run/systemd/generator/networking.service.d
           ??50-insserv.conf-$network.conf
   Active: failed (Result: exit-code) since Sun 2016-09-11 16:47:36 MST; 1min 39s ago
     Docs: man:interfaces(5)
  Process: 5650 ExecStart=/sbin/ifup -a --read-environment (code=exited, status=1/FAILURE)
  Process: 5599 ExecStartPre=/bin/sh -c [ "$CONFIGURE_INTERFACES" != "no" ] && [ -n "$(ifquery --read-environment --list --exclude=lo)" ] && udevadm settle (cod=exited, status=0/SUCCESS)
 Main PID: 5650 (code=exited, status=1/FAILURE)

Sep 11 16:47:31 asdf systemd[1]: Starting Raise network interfaces...
Sep 11 16:47:33 asdf ifup[5650]: /sbin/ifup: waiting for lock on /run/network/ifstate.ens192
Sep 11 16:47:35 asdf ifup[5650]: RTNETLINK answers: File exists
Sep 11 16:47:35 asdf ifup[5650]: Failed to bring up ens192.
Sep 11 16:47:36 asdf systemd[1]: networking.service: Main process exited, code=exited, status=1/FAILURE
Sep 11 16:47:36 asdf systemd[1]: Failed to start Raise network interfaces.
Sep 11 16:47:36 asdf systemd[1]: networking.service: Unit entered failed state.
Sep 11 16:47:36 asdf systemd[1]: networking.service: Failed with result 'exit-code'.

# journalctl -xe

Sep 11 16:47:35 asdf sh[5593]: RTNETLINK answers: File exists
Sep 11 16:47:35 asdf sh[5593]: Failed to bring up ens192.
Sep 11 16:47:35 asdf systemd[1]: ifup@ens192.service: Main process exited, code=exited, status=1/FAILURE
Sep 11 16:47:35 asdf ifup[5650]: RTNETLINK answers: File exists
Sep 11 16:47:35 asdf ifup[5650]: Failed to bring up ens192.
Sep 11 16:47:36 asdf systemd[1]: networking.service: Main process exited, code=exited, status=1/FAILURE
Sep 11 16:47:36 asdf systemd[1]: Failed to start Raise network interfaces.
Run Code Online (Sandbox Code Playgroud)

现在......对我来说有趣的是,如果我这样做:

# ifdown --force ens192 && ifup ens192
RTNETLINK answers: No such process
RTNETLINK answers: Cannot assign requested address
Waiting for DAD... Done
root@az-unixweb-1:~# ip -6 route
2001:xxxx:xxxx:xxxx::/64 dev ens192  proto kernel  metric 256  pref medium
fe80::/64 dev ens192  proto kernel  metric 256  mtu 1500 pref medium
default via 2001:xxxx:xxxx:xxxx::1 dev ens192  metric 1024  pref medium
Run Code Online (Sandbox Code Playgroud)

执行 ifdown --force 后,我还可以成功启动和停止网络服务。

如您所见,它现在从我的 /etc/network/interfaces 文件中获取配置,如下所示:

auto lo
iface lo inet loopback
iface ens192 inet static
        address a.b.c.d
        netmask 255.255.255.224
        gateway a.b.c.r
        dns-nameserver a.b.c.dns
iface ens192 inet6 static
        address 2001:xxxx:xxxx:xxxx::44
        netmask 64
        gateway 2001:xxxx:xxxx:xxxx::1
        dns-nameserver 2001:xxxx:xxxx:xxxx::42
        dns-nameserver 2001:470:20::2
auto ens192
Run Code Online (Sandbox Code Playgroud)

通过这种配置,我完全期望上面的路由表给我什么。自从我最初提出这个问题以来,这个配置一直保持不变。如果我重新启动,该服务将再次失败,它会重新使用自动配置的地址,加上我配置的地址,再加上仅使用 RA 通告的路由(30 分钟)。

所以......它仍然坏了,依赖于网络服务启动的服务在启动时也会失败。

dod*_*ron 1

好吧,这并不是真正理想的解决方案,因为我想要一个完全静态的配置,但现在我确实有一个工作配置。

我从文件中删除了网关行/etc/network/interfaces并重新启动。这允许网络服务在启动时启动,并导致我通过 RA 机制配置了默认路由。现在的区别在于,当我的路由器发出 RA 时,路由实际上每 30 秒刷新一次,而之前,使用该文件中指定的网关行,RA 路由从未刷新并最终超时。

老实说,这对我来说感觉像是一个错误,除非我错过了一些基本的东西......