我很难重现Perl进程挂起的情况。我不确定它挂在哪里。ps ax | grep <process name>将stat列显示为SN,据我了解,这意味着它处于休眠状态并且正在优先运行。
我查看了脚本(里面有很多代码),但是看不到任何持续超过几秒钟的特定睡眠(此过程已经睡眠了一天以上)。
我无法重新启动并将日志添加到Perl脚本中,因为该条件可能无法重现。我可以尝试,strace但想知道是否有更好的机制
一种可能的方法是使用gdb。
首先,您需要为perl解释器调试符号。例如,在我的Debian系统上,我必须为此安装perl-debug软件包。安装完成后/usr/lib/debug/usr/bin/perl,我们稍后会将其传递给gdb。请注意,原始的,受阻的Perl脚本是使用/usr/bin/perl而不是新安装的调试版本启动的。
为了这个示例,让我们运行以下Perl脚本:
$ cat test.pl
#! /usr/bin/perl
use strict;
use warnings;
print "pid: ", $$, "\n";
while (1) {
print "line ", __LINE__, "\n"; sleep 1;
print "line ", __LINE__, "\n"; sleep 1;
}
Run Code Online (Sandbox Code Playgroud)
当我们运行它时,我们得到如下输出:
$ ./test.pl
pid: 15764
line 9
line 10
line 9
line 10
^C
Run Code Online (Sandbox Code Playgroud)
现在让我们启动gdb。使用立即运行的test.pl打印的pid。在一些初始信息(“从...读取符号”)之后,我们会提示您:
$ gdb /usr/lib/debug/usr/bin/perl 15809
[snip]
(gdb)
Run Code Online (Sandbox Code Playgroud)
同时,由于将gdb附加到perl解释器,perl停止了:
$ ./test.pl
pid: 15809
line 9
line 10
[snip]
line 9
line 10
line 9
[no further output]
Run Code Online (Sandbox Code Playgroud)
现在,让我们回到gdb进行回溯:
(gdb) backtrace
#0 0x00007fd5b4479830 in __nanosleep_nocancel () at ../sysdeps/unix/syscall-template.S:82
#1 0x00007fd5b44796c0 in __sleep (seconds=<optimized out>) at ../sysdeps/unix/sysv/linux/sleep.c:138
#2 0x00007fd5b4efc1e2 in Perl_pp_sleep (my_perl=0x1a91010) at pp_sys.c:4586
#3 0x00007fd5b4ea89b6 in Perl_runops_standard (my_perl=0x1a91010) at run.c:41
#4 0x00007fd5b4e4a585 in S_run_body (oldscope=1, my_perl=0x1a91010) at perl.c:2350
#5 perl_run (my_perl=0x1a91010) at perl.c:2268
#6 0x0000000000400f89 in main (argc=2, argv=0x7fff4de87628, env=0x7fff4de87640) at perlmain.c:120
Run Code Online (Sandbox Code Playgroud)
很可能,perl恰好在sleep()的中间停止了。但是哪一个呢?
现在,我们需要确定在当前正在执行的(Perl)源文件和行中查找perl内部信息的位置。最初,我在mod_perl的重复代码中发现了一些相关信息。curinfo在其中寻找宏。
(gdb) p my_perl->Icurcop->cop_file
$1 = 0x1abd810 "./test.pl"
(gdb) p my_perl->Icurcop->cop_line
$2 = 9
Run Code Online (Sandbox Code Playgroud)
如我们所见,我们位于test.pl的第9行-根据脚本的输出,这是预期的。
链接的文档中提到了有关线程/非线程Perl二进制文件的一些区别(上面的示例适用于线程Perl,v5.14.2)。它也看起来有些过时,因为它在谈论my_perl->Tcurcop,而我以的名义找到了我想要的东西my_perl->Icurcop。目前,我对perl的内部知识还不够熟悉,无法说明为什么将其重命名。
我希望这有帮助。