我需要运行一个长时间运行的子进程,如果我(出于任何原因)退出父应用程序,则将其终止。
这是代码:
cmd := exec.Command("./long-process")
defer cmd.Process.Kill()
if err != nil {
log.Fatal(err)
}
var fail io.ReadCloser
fail.Close()
Run Code Online (Sandbox Code Playgroud)
这里fail产生明显的
panic: runtime error: invalid memory address or nil pointer dereference
Run Code Online (Sandbox Code Playgroud)
它按预期工作 - 子进程被终止。
但这发生在 goroutine 中:
cmd := exec.Command("./long-process")
defer cmd.Process.Kill()
if err != nil {
log.Fatal(err)
}
go func() {
var fail io.ReadCloser
fail.Close()
}()
Run Code Online (Sandbox Code Playgroud)
恐慌仍然发生,但似乎defer没有被调用,子进程也没有被杀死。
有办法解决这个问题吗?
更新我需要一个跨平台解决方案(至少对于 Linux 和 FreeBSD)
最小的例子:
infinite-loop.sh
#!/bin/bash
while true; do
sleep 1
done
Run Code Online (Sandbox Code Playgroud)
别忘了
chmod +x infinite-loop.sh
Run Code Online (Sandbox Code Playgroud)
test1.go(为简洁起见,省略了错误检查):
package main
import (
"time"
"io"
"os/exec"
"runtime"
)
func main() {
cmd := exec.Command("./infinite-loop.sh")
cmd.Start()
defer cmd.Process.Kill()
go func() {
time.Sleep(100 * time.Millisecond)
var fail io.ReadCloser
fail.Close()
}()
for {
runtime.Gosched()
}
}
Run Code Online (Sandbox Code Playgroud)
我们跑吧
ps aux | grep infinite-loop.sh | grep -v grep | wc -l; \
go run test1.go; \
ps aux | grep infinite-loop.sh | grep -v grep | wc -l
0 <--- !!
panic: runtime error: invalid memory address or nil pointer dereference
[signal 0xb code=0x1 addr=0x20 pc=0x2130]
goroutine 5 [running]:
main.main.func1()
.../multiline/test1.go:19 +0x30
created by main.main
.../multiline/test1.go:20 +0x9a
goroutine 1 [runnable]:
runtime.Gosched()
/usr/local/Cellar/go/1.5.1/libexec/src/runtime/proc.go:166 +0x14
main.main()
.../multiline/test1.go:23 +0x9f
exit status 2
1 <--- !!
Run Code Online (Sandbox Code Playgroud)
退出前有 0 个进程,退出后有 1 个进程。
如果你注释掉 goroutine 代码 - 它工作得很好。
现在我们可以杀死它:
kill $(ps aux | grep infinite-loop.sh | grep -v grep | awk {'print $2'})
Run Code Online (Sandbox Code Playgroud)
没有跨平台解决方案可以自动终止子进程。
在 Linux 上,您可以使用以下pdeathsig功能:
cmd := exec.Command("./long-process")
cmd.SysProcAttr = &syscall.SysProcAttr{
Pdeathsig: syscall.SIGTERM,
}
Run Code Online (Sandbox Code Playgroud)
在其他平台上,孩子需要自行确定何时退出。一种方法是监视从父级提供给它的管道或套接字 FD。您还可以让某种流程管理器监视流程并在出现问题时进行清理。
但一般来说,恐慌应该很少见并得到修复。如果您确实有容易出现恐慌的代码区域,您可以在本地恢复并在退出之前调用清理子进程。