我有已完成作业的 ID。如何查看其详细信息,例如执行时间、分配的节点等?我记得 SGE 有一个命令(qacct?)。但我找不到 PBS 或 Torque。谢谢。
由于作业统计需要 root 访问权限才能查看已完成的作业,或者集群管理员已经安装了 pbstools(都不受用户控制),我发现最简单的方法是放置一个
tracejob $PBS_JOBID
Run Code Online (Sandbox Code Playgroud)
在提交脚本的最后一行。如果调度程序是 MAUI,则 checkjob -vv $PBS_JOBID是另一种选择。这些命令可以重定向到单独的输出文件:
tracejob $PBS_JOBID > $PBS_O_WORKDIR/$PBS_JOBID.tracejob
Run Code Online (Sandbox Code Playgroud)
也应该可以将此作为用户结语脚本运行,以使其在作业之间更可重用。
现在,在 TORQUE 中获取此信息的唯一方法是查看记帐日志。您可以 grep 查找作业 ID 并查看该作业的会计记录,如下所示:
04/30/2014 15:20:18;Q;5000.bob;queue=batch
04/30/2014 15:33:00;S;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 owner=dbeer@bob exec_host=bob/0
04/30/2014 15:36:20;E;5000.bob;user=dbeer group=dbeer jobname=STDIN queue=batch ctime=1398892818 qtime=1398892818 etime=1398892818 start=1398893580 owner=dbeer@bob exec_host=bob/0 session=22933 end=1398893780 Exit_status=0 resources_used.cput=00:00:00 resources_used.mem=2580kb resources_used.vmem=37072kb resources_used.walltime=00:03:20
Run Code Online (Sandbox Code Playgroud)
不幸的是,要直接执行此操作,您必须具有 root 访问权限。为了解决这个问题,有一些工具(例如pbsacct)可以帮助更好地浏览它。pbsacct 是 pbstools 包的一部分,您可以通过该链接访问该包。
| 归档时间: |
|
| 查看次数: |
8071 次 |
| 最近记录: |