如何获取已完成的 PBS 或 Torque 作业的信息?

use*_*611 5 shell pbs torque

我有已完成作业的 ID。如何查看其详细信息,例如执行时间、分配的节点等?我记得 SGE 有一个命令(qacct?)。但我找不到 PBS 或 Torque。谢谢。

jvd*_*d10 5

由于作业统计需要 root 访问权限才能查看已完成的作业,或者集群管理员已经安装了 pbstools(都不受用户控制),我发现最简单的方法是放置一个

tracejob $PBS_JOBID
Run Code Online (Sandbox Code Playgroud)

在提交脚本的最后一行。如果调度程序是 MAUI,则 checkjob -vv $PBS_JOBID是另一种选择。这些命令可以重定向到单独的输出文件:

tracejob $PBS_JOBID > $PBS_O_WORKDIR/$PBS_JOBID.tracejob
Run Code Online (Sandbox Code Playgroud)

也应该可以将此作为用户结语脚本运行,以使其在作业之间更可重用。


dbe*_*eer 0

现在,在 TORQUE 中获取此信息的唯一方法是查看记帐日志。您可以 grep 查找作业 ID 并查看该作业的会计记录,如下所示:

04/30/2014 15:20:18;Q;5000.bob;queue=batch
04/30/2014 15:33:00;S;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 owner=dbeer@bob exec_host=bob/0 
04/30/2014 15:36:20;E;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 owner=dbeer@bob exec_host=bob/0 session=22933 end=1398893780 Exit_status=0 resources_used.cput=00:00:00 resources_used.mem=2580kb resources_used.vmem=37072kb resources_used.walltime=00:03:20
Run Code Online (Sandbox Code Playgroud)

不幸的是,要直接执行此操作,您必须具有 root 访问权限。为了解决这个问题,有一些工具(例如pbsacct)可以帮助更好地浏览它。pbsacct 是 pbstools 包的一部分,您可以通过该链接访问该包。