显示 slurm 作业的 GPU 内存使用情况和利用率

Zha*_*hao 6 gpu slurm

我正在使用 slurm 来访问 GPU 资源。是否可以显示正在运行的 slurm 作业的 GPU 使用情况?就像nvidia-smi在普通的交互式 shell 中使用一样。

小智 5

您可以使用 ssh 登录您的作业节点。然后使用nvidia-smi。这个对我有用。例如,我使用 squeue 检查我的作业 xxxxxx 当前正在节点 xxx 上运行。然后我使用 ssh xxx 访问该节点。之后,您可以使用nvidia-smi来检查GPU的使用情况。