我在solaris服务器上运行了一个shell脚本,它是一个非常复杂的脚本,可以调用其他一些shell或perl脚本,整个执行成本很长一段时间 - 几个小时.
奇怪的是,它总是异常退出.我用"truss"命令记录shell进程的系统调用.它表明原因似乎是信号#15 SIGTERM的到来.但我不知道#15来自哪里?有什么方法可以检测出来自哪个过程的信号?
我的服务器信息:
uname -a
SunOS zsups379 5.10 Generic_144488-07 sun4u sparc SUNW,Sun-Fire-880
Run Code Online (Sandbox Code Playgroud)
桁架输出切片(23528是主进程,25213是23528的子进程):
25213/2: read(8, "17A6 G8A078A 58E15 P9E 5".., 8192) = 8192
25213/1: Received signal #15, SIGTERM, in lwp_wait() [caught]
23528: Received signal #15, SIGTERM, in waitid() [caught]
25213/2: write(9, " X #85 f @F5 Z88CAFB J\n".., 515) = 515
23528: waitid(P_ALL, 0, 0xFFBFD958, WEXITED|WTRAPPED|WSTOPPED|WCONTINUED) Err#91 ERESTART
25213/1: lwp_wait(2, 0xFFBFD39C) Err#91 ERESTART
25213/1: lwp_sigmask(SIG_SETMASK, 0xFFBFFEFF, 0x0000FFF7) = 0xFFBFFEFF [0x0000FFFF]
23528: lwp_sigmask(SIG_SETMASK, 0x00004000, 0x00000000) = 0xFFBFFEFF [0x0000FFFF]
....
Run Code Online (Sandbox Code Playgroud)
您可以使用类似于该脚本的dtrace脚本轻松跟踪发送到您的进程的所有信号:
proc:::signal-send
/ args[2] == 15 /
{
printf("Process %d (%s) killing %d (%s)\n",
pid, execname, args[1]->pr_pid, args[1]->pr_fname);
}
Run Code Online (Sandbox Code Playgroud)