首先,这里有一些上下文。
我们有一个自定义构建的 PHP 应用程序,它在 Apache 下运行并支持我们的网站。
我们目前在我们的网站上遇到高流量。这是我们当前的设置: - 负载均衡器后面的 10 个 linux Web 服务器(每个服务器有 8 个 CPU,30Go RAM) - 1 个 linux mysql 数据库服务器(30 个 CPU,120 个 Go RAM)
大部分时间流量保持良好,但有时出于不确定的原因,我们看到活动 mysql 连接总数激增。它一直在泄漏,直到达到最大值并最终导致我们的 Web 用户无法使用该应用程序。
发生这种情况时,在平均负载、内存、CPU 使用率、磁盘交换方面,所有服务器都很好。他们有很多可用的资源。
我们确实注意到有许多 Apache 进程具有 CLOSE_WAIT 连接状态。我们在其中一台 Web 服务器中看到了大约 600 个处于该状态的进程。
这似乎是我们遇到的问题的征兆。但是,我们很难深入挖掘。这是我的问题:
提前感谢您的帮助,