gpt4 book ai didi

nginx - php-fpm 进程监控/分析

转载 作者:IT王子 更新时间:2023-10-29 00:21:50 24 4
gpt4 key购买 nike

我最近遇到了一个问题,php-fpm 进程的使用(如事件进程的数量)达到最大可用进程的峰值,并停止执行其他脚本,直到有问题的进程完成。

更详细一点,我当前的 php-fpm 设置是:

pm = static
pm.max_children = 100

我在看 php-fpm 的状态页面,大部分时间显示:

total processes: 100
idle processes: 95-99
active processes: 1-5

这是正常的。但是,每隔几分钟,事件进程数就会跳到 100 几秒钟,然后恢复到 1-5 的正常值。在那段时间里,服务器上运行的所有其他脚本都只是停留在那段时间。 (从浏览器中您只看到页面等待)。

现在,我检查了它是否在特定的流量高峰期,但事实并非如此。它也可能发生在当天流量最少的时候。

我相信某个脚本,甚至可能只在特定情况下,导致 php 出于某种原因简单地使用所有可用进程。

当我们从 5.2.X 迁移到 PHP 5.4.X 时,这个问题就开始了

我们目前有大约 60 个网站,因此很难浏览每个网站的页面并进行检查。

nginx 日志中没有任何内容(反正没有什么重要的,有一些通知等)。

我想做的是以某种方式跟踪/分析/监控哪个 php-fpm 脚本正在使用这些进程,这样我就知道从哪里开始寻找问题。

这可能吗?也许是不同的方法?

更新

这是 1 小时内 PHP-FPM 进程计数的图表,间隔为 1 分钟:

graph

我用红色标记了我正在谈论的跳跃。峰值时的内存使用保持不变

最佳答案

在您的 php-fpm 日志文件中,您应该能够看到如下内容:

 WARNING: [pool www-images] server reached pm.max_children setting (5), consider raising it.

当事件进程数达到限制时。您应该能够将其与传入的请求相关联。

如果这没有显示出导致问题的请求的任何模式,那么您应该将慢速日志记录添加到您的 php-fpm 配置中:

request_slowlog_timeout = 10
slowlog = /var/log/php-fpm/slow.$pool.log

将为每个占用超过 slowlog_timeout 限制的请求记录堆栈跟踪。

如果仍然没有显示任何内容,那么您的内部应用程序日志记录应该会显示减速发生的位置。

如果没有足够的细节,那么你可以使用 strace作为最后的手段,它将显示正在进行的系统调用。这将产生大量信息。我建议只将它附加到单个进程 strace -p PID,其中 PID 是 php-fpm 实例的进程 ID。

it can also occur with the lowest traffic count of the day.

这肯定会出现在 php-fpm 慢速日志记录中。但是,如果这仅向您显示哪些请求很慢,而不能帮助您找出原因,您可以在 PHP-FPM 配置文件中使用自动前置和后置文件添加调试。

php_value[auto_prepend_file]=/php_shared/prepend.php
php_value[auto_append_file]=/php_shared/postpend.php

或者真的很简单

您可以设置 PHP-FPM 状态页面。

将此添加到您的 PHP-FPM 池配置中:

pm.status_path = /www-status

并通过nginx将请求传递给PHP-FPM

location ~ ^/(www-status)$ {
include %mysite.root.directory%/conf/fastcgi.conf;
fastcgi_pass unix:%phpfpm.socket%/php-fpm-www.sock;

# or IP address
# fastcgi_pass 127.0.0.1:9000;

#If you're fastcgi.conf doesn't set the query_string
#pass the query string here instead.
# fastcgi_param QUERY_STRING $query_string;


fastcgi_index index.php;
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;

allow 127.0.0.1;
allow stats_collector.localdomain;
allow watchdog.localdomain;
deny all;
}

然后转到 yoursite.com/www-status?full 将为您提供每个 php-fpm 进程的大字体,例如:

pool:                 www
process manager: dynamic
start time: 18/Mar/2013:20:17:21 +1100
start since: 243
accepted conn: 3
listen queue: 0
max listen queue: 0
listen queue len: 0
idle processes: 3
active processes: 1
total processes: 4
max active processes: 1
max children reached: 0
slow requests: 0

************************
pid: 6233
state: Idle
start time: 18/Mar/2013:20:17:21 +1100
start since: 243
requests: 1
request duration: 631
request method: GET
request URI: /www-status
content length: 0
user: -
script: /documents/projects/intahwebz/intahwebz/basereality/www-status
last request cpu: 0.00
last request memory: 262144

顺便说一句,我敢打赌是一些愚蠢的查询锁定了您的数据库。

关于nginx - php-fpm 进程监控/分析,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15465333/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com