在linux中用子节点递归杀死R进程

Jer*_*oen 6 linux shell fork r process

我正在寻找一种通用的方法来启动然后杀死一个R进程,包括它可能调用的所有分支或其他进程.

例如,用户运行如下脚本:

library(multicore);
for(i in 1:3) parallel(foo <- "bar");
for(i in 1:3) system("sleep 300", wait=FALSE);
for(i in 1:3) system("sleep 300&");
q("no")
Run Code Online (Sandbox Code Playgroud)

用户退出R会话后,子进程仍在运行:

jeroen@jeroen-ubuntu:~$ ps -ef | grep R
jeroen    4469     1  0 16:38 pts/1    00:00:00 /usr/lib/R/bin/exec/R
jeroen    4470     1  0 16:38 pts/1    00:00:00 /usr/lib/R/bin/exec/R
jeroen    4471     1  0 16:38 pts/1    00:00:00 /usr/lib/R/bin/exec/R
jeroen    4502  4195  0 16:39 pts/1    00:00:00 grep --color=auto R
jeroen@jeroen-ubuntu:~$ ps -ef | grep "sleep"
jeroen    4473     1  0 16:38 pts/1    00:00:00 sleep 300
jeroen    4475     1  0 16:38 pts/1    00:00:00 sleep 300
jeroen    4477     1  0 16:38 pts/1    00:00:00 sleep 300
jeroen    4479     1  0 16:38 pts/1    00:00:00 sleep 300
jeroen    4481     1  0 16:38 pts/1    00:00:00 sleep 300
jeroen    4483     1  0 16:38 pts/1    00:00:00 sleep 300
jeroen    4504  4195  0 16:39 pts/1    00:00:00 grep --color=auto sleep
Run Code Online (Sandbox Code Playgroud)

更糟糕的是,他们的父进程id是1,因此难以识别它们.是否有一种方法来运行R脚本的方式允许我随时递归杀死进程及其子进程?

编辑:所以我不想手动进入搜索和杀死进程.此外,我不想杀死所有R进程,因为可能有其他人正在做得很好.我需要一种方法来杀死一个特定的进程及其所有子进程.

Sim*_*nek 8

这主要是关于多核部分.孩子们正在等你收集结果 - 见?collect.通常情况下,你绝不应该在没有parallel规定的情况下进行清理,通常是在on.exit.multicore可以清理高级函数mclapply,但是如果你使用低级函数,那么你有责任进行清理(因为多核无法知道你是否故意让孩子们继续运行).

你的例子真的是假的,因为你甚至不考虑收集结果.但无论如何,如果这真的是你想要的,你将不得不在某个时候进行清理.例如,如果要在退出时终止所有子项,则可以这样定义.Last:

 .Last <- function(...) {
     collect(wait=FALSE)
     all <- children()
     if (length(all)) {
         kill(all, SIGTERM)
         collect(all)
     }
 }
Run Code Online (Sandbox Code Playgroud)

同样,以上不是推荐的处理方法 - 它是最后的手段.你应该真的分配工作和收集结果,如

jobs <- lapply(1:3, function(i) parallel({Sys.sleep(i); i}))
collect(jobs)
Run Code Online (Sandbox Code Playgroud)

至于一般过程子问题 - init仅在R退出后继承子项,但是.Last你仍然可以找到它们的pid,因为父进程在那时存在,所以你可以执行类似于多核情况的清理.