我有一个带有 4GB 内存、2GB 交换和 2 个 CPU 的 Debian 系统。我遇到了许多涉及 oom-killer 的系统故障。系统将在一分钟内正常工作,下一分钟将无法操作,控制台上会显示大量 oom-killer 消息。我已经两次添加了 1GB 的 RAM。 5
令我感到困惑的是,我使用 xymon 监控系统,并且没有提前收到任何警告。我有 CPU、网络和 ram 利用率的图表,但我没有看到其中任何一个表明存在问题的大“尖峰”。我会发布它们,但目前没有足够的声誉。
我发现了6。我也通过vmcom和vmlim得到一条红线。我/proc/sys/vm/overcommit_ratio从50改为90,红线消失了。如您所见,我有 500MB 可用内存、2GB 可用交换空间、1.2G 缓存。
我解决了问题,还是告诉 atop/linux 忽略它?
我想要一个稳定的系统。展望未来,我应该:
我正在寻找更好的方法来计算上述问题的答案。
谢谢。
ATOP输出
ATOP - www1 2013/06/20 10:32:14 10 seconds elapsed
PRC | sys 1.34s | user 7.48s | #proc 347 | #zombie 2 | #exit 53 |
CPU | sys 11% …Run Code Online (Sandbox Code Playgroud)