python多处理守护进程中的僵尸进程

Aar*_*son 5 python daemon multiprocessing zombie-process

在研究了python守护进程之后,这个步骤似乎是最强大的:http://www.jejik.com/articles/2007/02/a_simple_unix_linux_daemon_in_python/

现在我正在尝试在守护进程类中实现一个工作池,我认为它正在工作(我还没有彻底测试代码),除了在关闭时我得到一个僵尸进程.我已经读过我需要等待来自孩子的返回代码,但我还是看不出我到底需要做什么.

以下是一些代码段:

def stop(self):
    ...
    try:
        while 1:
            self.pool.close()
            self.pool.join()
            os.kill(pid, SIGTERM)
            time.sleep(0.1)
    ...
Run Code Online (Sandbox Code Playgroud)

在这里,我尝试os.killpg了一些os.wait方法,但没有任何改进.之前和之后我也玩过closing/ joining游泳池os.kill.这个循环,它永远不会结束,一旦它到达os.kill我得到一个僵尸进程.self.pool = Pool(processes=4)发生在__init__守护程序的部分中.从run(self)之后start(self),我会打电话self.pool.apply_async(self.runCmd, [cmd, 10], callback=self.logOutput).但是,我想在讨论之前解决这个僵尸进程.

如何在守护进程中正确实现池以避免这个僵尸进程?

wbe*_*rry 5

如果不知道子进程/守护进程进程中发生了什么,就不可能对答案有 100% 的信心,但请考虑是否可能是这样。由于子进程中有工作线程,因此实际上需要构建一些逻辑,以便在收到 SIGTERM 后加入所有这些线程。否则,您的进程可能无法退出(即使退出,您也可能无法正常退出)。为此,您需要:

  • 编写一个信号处理程序,用于捕获 SIGTERM 信号并为主线程触发事件的子进程/守护进程
  • 在子/守护进程的主线程中安装信号处理程序(非常重要)
  • SIGTERM 的事件处理程序必须向子进程/守护进程中的所有线程发出停止指令
  • 所有线程完成后都必须进行 join()ed(如果您假设 SIGTERM 会自动销毁您可能必须实现此逻辑的所有内容)
  • 一旦所有内容都加入并清理完毕,您就可以退出主线程

如果您有用于 I/O 和各种事情的线程,那么这将是一件真正的苦差事。

另外,我通过实验发现,当您使用信号处理程序时,事件侦听器的特定策略很重要。例如,如果使用 select.select() 则必须使用超时,如果发生超时则重试;否则你的信号处理程序将不会运行。如果您有一个用于事件的 Queue.Queue 对象,并且您的事件侦听器调用其 .get() 方法,则必须使用超时,否则您的信号处理程序将不会运行。(在虚拟机中用 C 实现的“真正的”信号处理程序会运行,但 Python 信号处理程序不会运行,除非您使用超时。)

祝你好运!