如何使用 systemd 管理一组 resque 工人？

Question

如何使用 systemd 管理一组 resque 工人？

Ben*_*Ben 2 ruby-on-rails upstart resque systemd ubuntu-18.04

我正在尝试将一组 resque 工人的控制权从暴发户迁移到 systemd。在 upstart 下，我们可以有两个控制脚本，一个脚本定义单个 worker，第二个脚本多次调用第一个脚本以使用单个 upstart 命令启动或停止多个 worker。我们正在尝试使用 systemd 实现相同的功能。

我试过每个工人使用一个 systemd 单元，所以如果我们尝试管理 6 个工人，我们使用 6 个单独的 systemd 单元脚本，每个工人一个。然后我们使用一个 bash 脚本来触发：

systemctl start|stop|restart worker-1.service &
systemctl start|stop|restart worker-2.service &
...

Run Code Online (Sandbox Code Playgroud)

问题是当我们通过 systemctl 发送终止信号时，它会立即终止父 resque 进程，导致任何分叉的子进程立即死亡，而不是在死亡之前完成他们的工作。我们能够使用 upstart 来实现这种确切的行为，其中父进程不会接受新工作（将停止分叉），并且在工作完成子工作进程后，允许子工作进程在工作时保持活动状态自行死亡。

在 systemd 下，工作人员都会立即死亡，工作在中途终止，然后才能完成。

我们的 systemd 单元脚本如下所示：

[Unit]
Description=Controls a single Resque worker process: worker-1
After=redis.service

[Service]
Restart=on-failure
RestartSec=10
StartLimitInterval=400
StartLimitBurst=5
KillSignal=SIGQUIT

User=www-data
WorkingDirectory=/app/working/dir
Type=single
ExecStart=/usr/bin/bundle exec rake production resque:work QUEUE=a,b,c,d,e,f
ExecStop=/bin/kill -QUIT $MAINPID

[Install]
WantedBy=multi-user.target

Run Code Online (Sandbox Code Playgroud)

我已经尝试将 Type=single 更改为 Type=forking，但是该进程并没有保持不变，它会尝试启动，然后当没有可用的工作时，因为父进程仅在有工作时分叉，所以该进程死亡并且无法熬夜。使用 Type=simple，流程按预期工作，但如上所述，我们无法像使用 upstart 那样优雅地控制它们。

我们的 bash 脚本如下所示：

systemctl $COMMAND resque-worker-1.service &

Run Code Online (Sandbox Code Playgroud)

每个工人服务都有一个命令。$COMMAND 只是传递给 (start|stop|restart) 脚本的参数。

以前的新贵脚本使用：

在运行级别启动 [2345] 在运行级别停止 [06]

终止信号 QUIT

Answer 1

Ben*_*Ben 5

认为我自己解决了这个问题。通过删除此指令：

ExecStop=/bin/kill -QUIT $MAINPID

Run Code Online (Sandbox Code Playgroud)

当我现在发出 systemctl stop resque-worker-n.service 时，它会优雅地等待工作完成，然后再杀死工作人员。

尽管注意到某些工作仍会立即退出，因此添加了以下指令：

KillMode=process

Run Code Online (Sandbox Code Playgroud)

但是后来注意到，当稍后重新启动工作程序时，“已完成”的作业被 resque 认为是可排队的，因此会再次错误地排队。所以添加了这个指令：

SendSIGKILL=no

Run Code Online (Sandbox Code Playgroud)

现在的行为似乎与我们之前使用 upstart 的行为相同。

归档时间：	7 年，3 月前
查看次数：	611 次
最近记录：	7 年，3 月前