是否可以在 SLURM 中暂停当前正在运行的提交脚本?

Cha*_*ker 9 slurm

我有一些脚本发送到我可以使用 sbatch 访问的集群。但是,我想暂停这些正在运行的脚本,而不必取消它们的工作,因为它们已经运行了一段时间了。

有没有办法在不取消已经完成的作业的情况下保持/暂停当前正在运行的作业?

我在以下网站中发现可以通过以下方式暂停它们:

To pause a particular job:

scontrol hold <jobid>
Run Code Online (Sandbox Code Playgroud)

但是,我仍然有点不确定如何使其与作业数组一起使用。

fra*_*sus 10

我相信

scontrol suspend
Run Code Online (Sandbox Code Playgroud)

做你想做的事。从文档中:

暂停 作业列表

暂停正在运行的作业。job_list 参数是逗号分隔的作业 ID 列表。使用resume命令恢复其执行。用户进程必须在收到 SIGSTOP 信号后停止,并在收到 SIGCONT 信号后恢复,此操作才能生效。并非所有架构和配置都支持作业暂停。如果暂停的作业重新排队,它将被置于保留状态。