我有一些脚本发送到我可以使用 sbatch 访问的集群。但是,我想暂停这些正在运行的脚本,而不必取消它们的工作,因为它们已经运行了一段时间了。
有没有办法在不取消已经完成的作业的情况下保持/暂停当前正在运行的作业?
我在以下网站中发现可以通过以下方式暂停它们:
To pause a particular job:
scontrol hold <jobid>
Run Code Online (Sandbox Code Playgroud)
但是,我仍然有点不确定如何使其与作业数组一起使用。
fra*_*sus 10
我相信
scontrol suspend
Run Code Online (Sandbox Code Playgroud)
做你想做的事。从文档中:
暂停 作业列表
暂停正在运行的作业。job_list 参数是逗号分隔的作业 ID 列表。使用resume命令恢复其执行。用户进程必须在收到 SIGSTOP 信号后停止,并在收到 SIGCONT 信号后恢复,此操作才能生效。并非所有架构和配置都支持作业暂停。如果暂停的作业重新排队,它将被置于保留状态。
| 归档时间: |
|
| 查看次数: |
15018 次 |
| 最近记录: |