如何使用 slurm 在特定节点上运行作业?

Ras*_*oul 5 cluster-computing slurm cvx

我最初的问题是如何在集群上运行 CVX 工具箱(具有学术许可证)。我无法找到直接的方法来做到这一点,所以我决定以不同的方式解决这个问题。

CVX 许可证依赖于硬件,每个学术许可证与 4 个硬件绑定。我想将其中一个节点(可能是两个)添加到许可证列表中。为此,我需要始终在相同的硬件或节点上运行 CVX(我知道这可能不是一种有效的方法)。有什么办法可以做到吗?

dam*_*ois 11

如果您是管理员,您应该定义feature与安装该软件的节点(例如feature=cvx,在slurm.conf)关联的 ,并要求用户使用 提交作业--constraint=cvx

如果您是普通用户并且无法更改 Slurm 配置,则可以使用 指定特定节点--nodelist=...,或者,如果您需要多个节点之一,请使用--exclude=...所有未安装 CVX 的节点的列表。

  • “-w”是“--nodelist”选项的简短版本。 (2认同)