Perl,Parallel :: ForkManager - 如何实现fork的超时

gib*_*gib 7 parallel-processing perl fork timeout

是否可以使用Parallel :: ForkManager为fork实现某种超时(时间限制)?

Basic Parallel :: ForkManager脚本如下所示

use Parallel::ForkManager;
my $pm = Parallel::ForkManager->new( 10 );
for ( 1 .. 1000 ) {
    $pm->start and next;
    # some job for fork
    $pm->finish;
}
$pm->wait_all_children();
Run Code Online (Sandbox Code Playgroud)

我想限制时间为"#for work for fork".例如,如果它没有在90秒内完成.那么它(fork)应该被杀死/终止.我想过使用它,但我不得不说,我不知道如何在Parallel :: ForkManager中使用它.

编辑

感谢hobbs和ikegami.你的建议都有效.....但只是在这个基本的例子中,而不是在我的实际脚本中:(. 截图 这些叉子将永远存在 - 说实话 - 我不知道为什么.我使用这个脚本几个月.没有改变任何东西(虽然许多事情取决于外部变量).每个fork都必须从网站下载页面,解析它并将结果保存到文件中.每叉不应超过30秒.超时设置为180秒.那些悬挂叉是完全随机的,因此很难追踪问题.这就是为什么我想出一个临时的,简单的解决方案 - 超时和杀死.

什么可能在我的代码中禁用(中断)你的超时方法?alarm()我的代码中没有任何其他地方.

编辑2

其中一个叉子,悬挂1小时38分钟并返回"超时PID" - 这就是我输入die()的内容alarm().所以超时工作...但它的晚期大约1小时36分钟;).你有什么想法?

pil*_*row 8

更新

很抱歉在收盘后更新,但如果我没有指出Parallel :: ForkManager也支持run_on_start回调,我会失职.这可用于安装"子注册"功能,该功能负责time()为您设置PID.

例如,

$pm->run_on_start(sub { my $pid = shift; $workers{$pid} = time(); });
Run Code Online (Sandbox Code Playgroud)

结果是,结合run_on_wait如下所述,P :: FM的主循环不需要做任何特殊的事情.也就是说,它可以保持简单$pm->start and next,回调将处理其他所有事情.

原始答案

Parallel :: ForkManager的run_on_wait处理程序和一些簿记可以强制挂起和ALRM证明的孩子终止.

该功能注册的回调可以定期运行,$pm等待终止孩子.

use strict; use warnings;
use Parallel::ForkManager;

use constant PATIENCE => 90; # seconds

our %workers;

sub dismiss_hung_workers {
  while (my ($pid, $started_at) = each %workers) {
    next unless time() - $started_at > PATIENCE;
    kill TERM => $pid;
    delete $workers{$pid};
  }
}

...

sub main {
  my $pm = Parallel::ForkManager->new(10);
  $pm->run_on_wait(\&dismiss_hung_workers, 1);  # 1 second between callback invocations

  for (1 .. 1000) {
    if (my $pid = $pm->start) {
      $workers{$pid} = time();
      next;
    }
    # Here we are child.  Do some work.
    # (Maybe install a $SIG{TERM} handler for graceful shutdown!)
    ...
    $pm->finish;
  }

  $pm->wait_all_children;

}
Run Code Online (Sandbox Code Playgroud)

(正如其他人所说,最好让孩子通过自我调节alarm(),但这对你来说似乎是间歇性的.你也可以采取浪费,粗暴的行为,比如每个孩子本身fork() or exec('bash', '-c', 'sleep 90; kill -TERM $PPID').)