问题:我的 Ubuntu VPS 偶尔会出现网络问题。我无法通过 SSH 连接到盒子,也无法通过 IP 地址 ping 盒子。我可以通过主机串行终端访问盒子。当我通过串行访问盒子时,即使通过 IP 地址 ping,我也无法在任何地方 ping 出(据我所知)。一段时间后,网络恢复正常,有时无需我的干预。有时当我摆弄时它会回来。但很难说为什么。(编辑:它一直持续 1 小时)
问题:如何继续解决此问题?我可以做些什么来排除我控制中的配置/软件问题,以便我可以更轻松地向我的 VPS 主机提出问题?
我尝试过的事情:
细节:
netstat -rn
内核IP路由表
目标网关 Genmask 标志 MSS 窗口 irtt Iface
10.8.0.2 0.0.0.0 255.255.255.255 呃 0 0 0 tun0
XX.57.166.0 0.0.0.0 255.255.255.128 U 0 0 0 eth0
192.168.50.0 10.8.0.2 255.255.255.0 UG 0 0 0 tun0
10.8.0.0 10.8.0.2 255.255.255.0 UG 0 0 0 tun0
0.0.0.0 XX.57.166.1 0.0.0.0 UG 0 0 0 eth0
ip路由列表
10.8.0.2 dev tun0 proto 内核范围链接 src 10.8.0.1
XX.57.166.0/25 dev eth0 proto 内核范围链接 src XX.57.166.59
192.168.50.0/24 通过 10.8.0.2 dev tun0
10.8.0.0/24 通过 10.8.0.2 dev tun0
默认通过 XX.57.166.1 dev eth0 metric 100
cat /etc/network/interfaces
自动 eth0
iface eth0 inet 静态
地址 XX.57.166.59
网关 XX.57.166.1
网络掩码 255.255.255.128
自动低速
iface lo inet环回
首先,如果您认为这是他们没有解决的供应商问题,我会强烈考虑迁移。当 VPS.net 的 SAN 不断崩溃(在此过程中关闭所有 VPS)时,我给予了 VPS.net 怀疑的好处,但在“我们已经永久修复了这个问题”几个月后,它仍然崩溃,我不得不投票支持我的钱包。
创办一家 VPS 公司非常容易(您实际上只需要一点数据中心空间和一些服务器),因此即使在您获得客户服务之前,它们的技术能力也并不完全相同。
但为了找出问题的根源,我首先要考虑阻止以交换告终的事情。保留交换,但做你必须做的事情,这样你就不会把事情推得太远。控制 Java 应用程序或添加更多 RAM。看看会发生什么。如果这种情况很常见,那么您不需要等待很长时间(或花费很多钱)就能看到结果。
与CPU相同。如果您的设备长时间以 100% 的速度运行,您需要确保它们不会干扰其他应用程序。最简单的工作方法可以通过将任何猖獗的应用程序的nice值设置为积极的值来完成。像 +10 这样的好值应该让系统在应用程序之前获得资源的完全优先级。侧边栏:好的值基本上意味着在 CPU 调度方面更有礼貌。具有低(例如-20)nice值的东西意味着它们将优先于所有其他具有较高nice值的东西。
如果可以的话,将测试扩展到其他本地网络项目。如果他们提供 DNS 解析器(正如许多服务器公司所做的那样),请不断对其进行 ping 操作(好吧,每分钟几次)并记录结果。如果您在停机期间仍然可以访问它,那么这不太可能是您的错。
正如我所说,如果这不是你的错,那就走吧。如果你花更多的时间试图解决这个问题,那么你就超过了与这些人呆在一起所能带来的任何好处。我个人在 Linode 拥有非常良好且长期的经验,但也有很多优秀的公司。