如何解决远程 Internet 路由问题?

Jay*_*itt 6 internet routing packet-loss traceroute

(这可能在 serverfault 上得到更好的回答,但它在技术上与服务器无关,因此欢迎提出建议......)

我们只是在工作时搬了办公室。我们在马萨诸塞州剑桥市,拥有 Comcast 企业级电缆调制解调器。每隔几天,在一天的大部分时间里,我们都无法访问一些(但不是全部)网站 - 例如,Slashdot。碰巧的是,我住在离办公室三英里的地方,而且我家里还有一个康卡斯特企业级电缆调制解调器。在工作中,我可以通过 ssh 连接到我家中的服务器,尽管我通过了一些相同的路由器 - 以及所有相同的通用 POP - 我在家中没有这些问题。

15 年前,我知道如何解决此问题并致电 NOC 并解决问题。如今,有了负载均衡器和虚拟 IP,我难住了。我尝试使用下面的跟踪路由联系 Savvis,他们说“这不是我们”。我将它们发送到 Slashdot,当然没有回应——但这不仅仅是一个 Savvis 问题,也不仅仅是一个 Slashdot 问题。

我们在 ping Google 的 8.8.8.8 时偶尔也会看到 10-30% 的数据包丢失;我不知道问题是否同时发生,而且我目前没有任何失败的跟踪路由,但是成功的跟踪路由离开111eighthave.ny.ibone.comcast.net并直接进入谷歌而没有点击 Savvis。

来自办公室的跟踪路由失败:

~% traceroute slashdot.org
traceroute to slashdot.org (216.34.181.45), 64 hops max, 52 byte packets
 1  * * *
 2  te-7-1-ur01.cambridge.ma.boston.comcast.net (68.87.36.241)  10.628 ms  7.029 ms  14.147 ms
 3  be-51-ar01.needham.ma.boston.comcast.net (68.85.162.157)  10.648 ms  13.714 ms  13.754 ms
 4  pos-2-1-0-0-cr01.newyork.ny.ibone.comcast.net (68.86.95.29)  20.171 ms  18.774 ms  17.866 ms
 5  pos-1-6-0-0-pe01.111eighthave.ny.ibone.comcast.net (68.86.87.110)  20.177 ms  18.549 ms  18.130 ms
 6  er2-tengig3-3.newyork.savvis.net (208.173.138.13)  20.854 ms  19.490 ms  16.720 ms
 7  cr1-tengig-0-8-3-0.newyork.savvis.net (204.70.198.13)  15.856 ms  20.863 ms  16.717 ms
 8  cr2-tengig-0-0-2-0.chicago.savvis.net (204.70.196.242)  59.632 ms  47.147 ms  52.665 ms
 9  hr2-tengigabitethernet-12-1.elkgrovech3.savvis.net (204.70.195.122)  40.771 ms  55.918 ms  39.418 ms
10  das4-v3044.ch3.savvis.net (64.37.207.206)  45.907 ms  45.159 ms  46.643 ms
11  64.27.160.198 (64.27.160.198)  42.509 ms  39.425 ms  67.412 ms
12  * * *
13  * * *
14  * * *
15  * * *
Run Code Online (Sandbox Code Playgroud)

来自家的成功跟踪路由:

~% traceroute slashdot.org
traceroute to slashdot.org (216.34.181.45), 64 hops max, 52 byte packets
 1  73.164.80.1 (73.164.80.1)  10.194 ms  13.718 ms  9.876 ms
 2  te-7-4-ur01.cambridge.ma.boston.comcast.net (68.85.160.17)  9.680 ms  6.937 ms  9.150 ms
 3  be-51-ar01.needham.ma.boston.comcast.net (68.85.162.157)  8.392 ms  7.986 ms  8.621 ms
 4  pos-2-2-0-0-cr01.newyork.ny.ibone.comcast.net (68.86.93.185)  16.350 ms  18.983 ms  19.961 ms
 5  pos-1-4-0-0-pe01.111eighthave.ny.ibone.comcast.net (68.86.86.194)  17.208 ms  16.946 ms  20.909 ms
 6  er2-tengig3-3.newyork.savvis.net (208.173.138.13)  16.934 ms  18.493 ms  23.790 ms
 7  cr2-tengig-0-15-4-0.newyork.savvis.net (204.70.198.17)  26.530 ms  16.009 ms  14.924 ms
 8  cr2-pos-0-7-3-0.chicago.savvis.net (204.70.192.109)  40.031 ms  39.496 ms  39.807 ms
 9  hr2-tengigabitethernet-12-1.elkgrovech3.savvis.net (204.70.195.122)  41.065 ms  45.294 ms  41.091 ms
10  das3-v3039.ch3.savvis.net (64.37.207.186)  47.867 ms  40.606 ms  40.157 ms
11  64.27.160.194 (64.27.160.194)  50.774 ms  56.097 ms  51.147 ms
12  slashdot.org (216.34.181.45)  39.788 ms  41.741 ms  39.871 ms
Run Code Online (Sandbox Code Playgroud)

Laz*_*ger 2

  1. 只是要注意:icmp 测试 (traceroute|ping) 并不总是准确和正确的 - 您可能与端点成功建立了 TCP 连接,但过滤了来自某些跃点(包括目的地)的 ICMP 响应,并且您无法检测到(简单)- 是否超时或抑制回显回复
  2. 对你来说相同的物理源位置并不意味着相同的网络(我看不到办公室IP,但我想它必须在68.87.3?网络中的某个地方,但家庭网络是73.164.80。)和相同的AS(自治系统),这是路由的基础(如果我以最简单的形式编写它并删除 NOC 详细信息)
  3. 为了排除故障,您可以检查 icmp-tcp 连接(就像您之前所做的那样,但对于 2 种类型更好),了解(更好)目标的 AS、良好源的 AS 和不良源的 AS,并将票证发送给 support@某事。靠近“检测到从您负责区域的 AS Y 到 AS X 的连接问题,而您的 AS Z 没有显示相同类型的问题”。如果好源和坏源具有相同的 AS,则仅网络就足够了。
  4. “这不是我们”不是 NOC 的答案!您可以阅读 SLA 以获得法律工具,或者只是要求(如果可以的话)“将问题升级”给管理层或沿途的邻居

华泰