小编KIs*_*may的帖子

使用 atop 对 oom-killer 进行故障排除:它是否已修复?

我有一个带有 4GB 内存、2GB 交换和 2 个 CPU 的 Debian 系统。我遇到了许多涉及 oom-killer 的系统故障。系统将在一分钟内正常工作,下一分钟将无法操作,控制台上会显示大量 oom-killer 消息。我已经两次添加了 1GB 的 RAM。 5

令我感到困惑的是,我使用 xymon 监控系统,并且没有提前收到任何警告。我有 CPU、网络和 ram 利用率的图表,但我没有看到其中任何一个表明存在问题的大“尖峰”。我会发布它们,但目前没有足够的声誉。

我发现了6。我也通过vmcom和vmlim得到一条红线。我/proc/sys/vm/overcommit_ratio从50改为90,红线消失了。如您所见,我有 500MB 可用内存、2GB 可用交换空间、1.2G 缓存。

我解决了问题,还是告诉 atop/linux 忽略它?

我想要一个稳定的系统。展望未来,我应该:

  1. 向下调整 Apache、Sendmail 等的最大子参数?使用ulimit?
  2. 调整 oom-killer sysctl 值以让我利用所有可用的内存和交换?
  3. 调整 swappiness 或其他内核值?

我正在寻找更好的方法来计算上述问题的答案。

谢谢。

ATOP输出

ATOP - www1               2013/06/20  10:32:14               10 seconds elapsed
PRC | sys   1.34s | user   7.48s | #proc    347 | #zombie    2 | #exit     53 |
CPU | sys     11% …
Run Code Online (Sandbox Code Playgroud)

linux debian oom-killer

4
推荐指数
1
解决办法
2258
查看次数

标签 统计

debian ×1

linux ×1

oom-killer ×1