我有一个使用以下命令运行的简单 test.ksh:
批量测试.ksh
我不断收到“JobState=FAILED Reason=NonZeroExitCode”(使用“scontrol show job”)
我已经确定了以下几点:
- slurmd 和 slurmctld 已启动并正常运行
- “test.ksh”的用户权限是 777。
- 命令“srun test.ksh”(本身,不使用sbatch)成功没有问题
- 我尝试在“test.ksh”的最后一行输入“return 0”而没有运气
- 我尝试在“test.ksh”的最后一行中放入“exit 0”而没有运气
- 我尝试在“test.ksh”的最后一行输入“hostname”,但没有运气
- 我尝试在“test.ksh”的最后一行输入“srun hostname”,但没有运气