Bla*_*lsh 5 ubuntu xen vps central-processing-unit
我们有一个在 Xen 上运行 Ubuntu 的 VPS。问题是,大约每天一次,大约 20-50 分钟,随机时间,服务器对外界完全没有响应。在这段时间之后,它再次变得响应,好像什么也没发生过一样,它不会失去正常运行时间,也不会重新启动。它只是再次开始响应,就好像它一直处于假死状态一样。
这些中断发生在非异常内存和 cpu 的条件下,例如 70% mem、5% cpu。我已经停止了所有非必要的服务,所以使用非常均匀。这些中断不会特别发生在内存/cpu 增加时(在日常任务期间),它们有时会在 cpu 使用率非常低 (<2%) 时发生,但在过去也发生在交换期间。
这些停电在 Ubuntu 12.04 LTS 和 Ubuntu 14.04 LTS 下都发生过——根本没有变化(我专门升级了 Ubuntu,看看它是否有助于解决这个问题)。
可以登录我们的虚拟主机站点,并使用他们的管理控制台查看这段时间内的错误消息。据推测,这些消息来自 Xen 虚拟化,主要消息如下:
BUG: soft lockp - CPU#0 stuck for 22s! [ksoftireqd/0:3] (repeats many times)
SysRq : Emergency Sync (Sometimes this is the only message in the console)
Run Code Online (Sandbox Code Playgroud)
之前在不同负载情况下看到的其他情况包括:
BUG: soft lockup - CPU#0 stuck for 22s! [swapper/0:0]
Run Code Online (Sandbox Code Playgroud)
(重复多次)或:
INFO: rcu_sched detected stall on CPU 0 (t=15000 jiffies)
Run Code Online (Sandbox Code Playgroud)
(随着 t 变大重复多次)
通过谷歌搜索,我尝试了各种内核参数,例如 nohz=off 和 acpi=off 都无济于事。所有技术支持人员都说其他 Ubuntu 安装没有遇到同样的问题。
任何人对这个问题有任何想法或经验?
好吧,无论我尝试什么,我都找不到解决这个问题的方法。最后我用 Debian 7.0 替换了 Ubuntu,问题就消失了,并且出现了一些异常的 CPU 使用率,这些异常没有显示在顶部,但确实显示在 VPS 监控面板中(此 CPU 使用率表现为逐渐增加超过 2- 3 天达到 10%,然后回落至 0%,导致 CPU 使用率图表上出现“锯齿”模式)。我没有尝试重新安装 Ubuntu(尽管我确实尝试升级到 14.04),因此我不能肯定地说用 Debian 替换 Ubuntu 就是解决方案。尽管如此,Debian 一直如人们所期望的那样坚如磐石,可悲的是,我也可以对 Ubuntu 的声誉说同样的话。我喜欢 Ubuntu,也绝对喜欢 Unity,但看来 Ubuntu 在广泛的硬件上确实不稳定。
我已经回答了我自己的问题,因为1)我确实找到了解决方案,2)我在其他地方找不到解决方案(除了CentOS,将CentOS 6降级到CentOS 5)所以这可能有用,如果可能不受欢迎给其他有这个问题的人。我知道我不会对解决方案感到满意:用 Debian 替换 Ubuntu!但最终我就是这样做来解决这个问题的。顺便说一句,我选择了 Debian,因为我没有发现有关 Debian 的此问题的报告,而我发现有关 Ubuntu 和 CentOS 的此问题的报告。
| 归档时间: |
|
| 查看次数: |
7684 次 |
| 最近记录: |