我正在向 SLURM 队列提交多个作业。每个作业使用 1 个 GPU。每个节点有 4 个 GPU。然而,一旦作业运行,它就会占用整个节点,留下 3 个 GPU 空闲。有什么方法可以避免这种情况,以便我可以将多个作业发送到一个节点,每个作业使用一个 GPU?
我的脚本如下所示:
#SLURM --gres=gpu:1
#SLURM --ntasks-per-node 1
#SLURM -p ghp-queue
myprog.exe
Run Code Online (Sandbox Code Playgroud) slurm ×1