带有 /ping 路由的 php-fpm 容器 livenessProbe

ers*_*les 7 php kubernetes fpm

最近我们遇到了一些问题,我们的 php-fpm 进程失控并导致站点无响应。有一些明显的 php-fpm 配置工具需要完成,但我还想为 php-fpm 容器实现合理的 livenessProbe 健康检查,当探测失败时,它将重新启动容器。

我已经挖掘了一些关于如何ping 服务器作为健康检查的资源(例如https://easyengine.io/tutorials/php/fpm-status-page/),但我还没有找到关于什么的好答案需要注意。如果服务器实际上已死,/ping 路由是否会返回“pong”以外的其他内容?它会超时吗?假设是后者,合理的超时限制是多少?

运行我自己的一些测试,我注意到一个健康的 php-fpm 服务器将快速返回“pong”响应:

# time curl localhost/ping
pong
real    0m0.040s
user    0m0.006s
sys 0m0.001s
Run Code Online (Sandbox Code Playgroud)

我模拟了重负载,确实需要 1-3 秒的“乒乓”响应时间,而这恰逢站点变得无响应。基于此,我草拟了一个 livenessProbe 的草稿,如果 liveness 探针脚本在 2 个连续的探针上花费的时间超过 2 秒,它将失败并重新启动容器:

livenessProbe:
  exec:
    command:
    - sh
    - -c
    - timeout 2 /var/www/livenessprobe.sh
  initialDelaySeconds: 15
  periodSeconds: 3
  successThreshold: 1
  failureThreshold: 2
Run Code Online (Sandbox Code Playgroud)

探针脚本就是这样(有一些原因,为什么这需要是一个 shell 脚本,而不是来自 livenessProbe 的直接 httpGet,我不会进入):

  #!/bin/bash

  curl -s localhost/ping
Run Code Online (Sandbox Code Playgroud)

现在我不知道是我太激进还是太保守了。我将运行金丝雀部署来测试这一点,但与此同时,我想从其他人那里获得一些反馈,这些人已经在 php-fpm 服务器上实施了健康检查,如果它在 Kubernetes 上下文中,则可以获得奖励积分。

小智 5

如果有人仍然对这个话题感兴趣。我正在研究类似的事情(php-fpm 监控与 kubernetes 中运行的 pod 相结合)。

我将以下运行状况检查设置https://github.com/renatomefi/php-fpm-healthcheck添加到我的容器(运行 php-fpm 的容器)中,以检查 php-fpm 是否运行良好:) 工作非常简单并且完成工作(当某些值超出预定义限制时,将容器标记为“坏”)