如何在Slurm中更新作业节点号?

Jas*_*son 3 slurm sbatch

我有一项待处理的工作,我想调整它的大小。我试过:

scontrol update job <jobid> NumNodes=128
Run Code Online (Sandbox Code Playgroud)

这是行不通的。

注意:我可以使用 更改walltime scontrol。但是当我尝试更改节点数时,它失败了。看来我可以根据此页面更改节点http://www.nersc.gov/users/computational-systems/cori/running-jobs/monitoring-jobs/

Jas*_*son 6

以下是我从 NERSC 帮助台获得的解决方案(感谢 LBNL 的 Woo-Sun Yang):

$ scontrol update jobid=jobid numnodes=new_numnodes-new_numnodes

例如$ scontrol update jobid=12345 numnodes=10-10

诀窍是让 numnodes 采用上述格式。它适用于缩小和扩展节点。