如何使用 Slurm 获得交互式会话?

sch*_*mmd 5 slurm

我找到了对srun --pty bash -i(请参阅https://slurm.schedmd.com/faq.html#prompt)的引用,但是当我在集群上运行它时,它会立即退出。

$ srun --pty bash -i
$ squeue
             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
               1  team     bash schmmd  R       0:02      1 team-server1
Run Code Online (Sandbox Code Playgroud)

我可以通过 获得交互式会话srun bash,但我没有 shell 提示符(例如$),并且我的会话如下所示:

$ srun bash
ls
miniconda3
Miniconda3-latest-Linux-x86_64.sh
test
Run Code Online (Sandbox Code Playgroud)

我的安装是否配置错误,或者我应该运行不同的命令?

$ srun --version
slurm 19.05.0
Run Code Online (Sandbox Code Playgroud)

Bub*_*nja 3

尝试一下salloc你的工作的要求。它将把您转发到包含所请求资源的新会话提示。

例如:

salloc -N1
Run Code Online (Sandbox Code Playgroud)

请求一个节点。

  • 经过一番调查后,“salloc”做了一些不同的事情。它分配一个节点来运行您的作业,但您拥有的终端仍在原始计算机上。不过,在“salloc”会话中,所有“srun”命令都将在分配的节点上运行。 (4认同)
  • AFAIK `salloc` 返回一个提示,并且它一直存在,直到您`exit`。 (2认同)