进程last-request-cpu的PHP-FPM池状态

Ter*_*Lee 2 php c php-extension php-internals

我已经安装了 PHP 并启用了 FPM 功能,但我对 FPM 状态数据(例如进程 Last-request-cpu)感到不确定,下面是我的 php-fpm.conf 详细信息。

[www]
; Unix user/group of processes
user = www-data
group = www-data

; Chdir to this directory at the start.
chdir = /

; The address on which to accept FastCGI requests.
listen = /var/run/phpfpm/$pool_php5-fpm.sock

; Set listen(2) backlog. A value of '-1' means unlimited.
listen.backlog = -1

; Set permissions for unix socket.
listen.mode = 0666

; Pool configuration.
pm = dynamic
pm.max_children = 10
pm.start_servers = 4
pm.min_spare_servers = 2
pm.max_spare_servers = 6
pm.max_requests = 500

; The URI to view the FPM status page.
pm.status_path = /status

; The ping URI to call the monitoring page of FPM.
ping.path = /ping

; The access log file.
access.log = /var/log/phpfpm/$pool_php-fpm.access.log

; The access log format.
access.format = %R - %u %t "%m %r%Q%q" %s %f %{mili}d %{kilo}M %C%%

; The log file for slow requests.
slowlog = /var/log/phpfpm/$pool_php-fpm.log.slow

; The timeout for serving a single request after which a PHP backtrace will be
; dumped to the 'slowlog' file. A value of '0s' means 'off'.
request_slowlog_timeout = 5

; Limits the extensions of the main script FPM will allow to parse.
security.limit_extensions = .php
Run Code Online (Sandbox Code Playgroud)

我已启用 pm.status_path = /status 来查看 FPM 状态结果,如下所示:

<?xml version="1.0" ?>
<status>
<pool>www</pool>
<process-manager>dynamic</process-manager>
<start-time>1418352728</start-time>
<start-since>21936</start-since>
<accepted-conn>20</accepted-conn>
<listen-queue>0</listen-queue>
<max-listen-queue>0</max-listen-queue>
<listen-queue-len>0</listen-queue-len>
<idle-processes>3</idle-processes>
<active-processes>1</active-processes>
<total-processes>4</total-processes>
<max-active-processes>1</max-active-processes>
<max-children-reached>0</max-children-reached>
<slow-requests>0</slow-requests>
<processes>
<process>
    <pid>11</pid>
    <state>Idle</state>
    <start-time>1418352728</start-time>
    <start-since>21936</start-since>
    <requests>5</requests>
    <request-duration>5391</request-duration>
    <request-method>GET</request-method>
    <request-uri>/status?xml&amp;full</request-uri>
    <content-length>0</content-length>
    <user>-</user><script>-</script>
    <last-request-cpu>0.00</last-request-cpu>
    <last-request-memory>262144</last-request-memory>
</process>
<process>
    <pid>12</pid>
    <state>Idle</state>
    <start-time>1418352728</start-time>
    <start-since>21936</start-since>
    <requests>5</requests>
    <request-duration>3365</request-duration>
    <request-method>GET</request-method>
    <request-uri>/status?xml&amp;full</request-uri>
    <content-length>0</content-length>
    <user>-</user><script>-</script>
    <last-request-cpu>297.18</last-request-cpu>
    <last-request-memory>262144</last-request-memory>
</process>
</processes>
</status>
Run Code Online (Sandbox Code Playgroud)

我不知道为什么元素last-request-cpu值297.18超过100,我想知道如何使用它作为监控信息..谢谢

Gor*_*don 5

该指标将告诉您最后一个请求使用了总cpu 时间的百分比。

CPU 时间(或处理时间)是指中央处理单元 (CPU) 用于处理计算机程序或操作系统指令的时间量,而不是等待输入/输出 (I/O) )操作或进入低功耗(空闲)模式。CPU 时间以时钟周期或秒为单位进行测量。

因此,它不是按照本页其他地方建议的以毫秒为单位来测量的。

您可以在以下位置查看实施情况

相关部分是这样的(为了可读性而重新格式化):

431    if (proc.cpu_duration.tv_sec == 0 && proc.cpu_duration.tv_usec == 0) {
432        cpu = 0.;
433    } else {
434        cpu = (proc.last_request_cpu.tms_utime 
                + proc.last_request_cpu.tms_stime 
                + proc.last_request_cpu.tms_cutime 
                + proc.last_request_cpu.tms_cstime) 
                / fpm_scoreboard_get_tick() 
                / (proc.cpu_duration.tv_sec 
                + proc.cpu_duration.tv_usec / 1000000.) 
                * 100.;
435    }
Run Code Online (Sandbox Code Playgroud)

结构成员tms proc.last_request_cpu定义为:

  • tms_utime结构成员是调用进程执行用户指令所占用的CPU时间。
  • tms_stime结构成员是系统代表调用进程执行的CPU时间。
  • 结构成员是子进程的和次数tms_cutime的总和。tms_utimetms_cutime
  • 结构成员是子进程的和次数tms_cstime的总和。tms_stimetms_cstime

因此,这意味着我们将上一次请求中所有可能的 cpu 时间相加。所有时间均以使用的时钟滴答数来衡量。

该函数将简单地返回每秒可能的滴答fpm_scoreboard_get_tick数,例如您的计算机每个内核每秒最多可以执行多少条指令。

结构成员定义timeval proc.cpu_duration为:

  • time_t tv_sec:这表示经过时间的整秒数。
  • long int tv_usec:这是剩余的已用时间(几分之一秒),以微秒数表示。始终低于一百万。

这是经过的时间(以秒为单位),包括任何小数,例如 2.456435663。

然后将该值乘以 100 即可得到百分比值。

例子:

假设我们的最后一个请求在 5 秒内总共消耗了 350 个刻度。我们还假设每秒最大滴答数为 100。如果我们将这些数字代入上面的等式,我们会得到

 (350 / 100 / 5) * 100 = 70
Run Code Online (Sandbox Code Playgroud)

这意味着最后一个请求使用了 70% 的可用 CPU 时间。

您获得高于 100% 的值的原因是因为每秒滴答数的值不受您拥有的核心数量的影响,而proc.last_request_cpu值将返回所有进程的滴答数,例如对数据库或某些其他数据源的访问可能发生在另一个进程,但直接受 PHP 执行的代码影响。所以这里考虑到了这一点。