COMPS - 节点已填充错误

J. *_*ero 5 java mpi compss pycompss

提交COMPS应用程序后,我收到以下错误消息,并且未执行该应用程序.

MPI_CMD=mpirun -timestamp-output -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/user/runcompss
--project=/tmp/1668183.tmpdir/project_1458303603.xml
--resources=/tmp/1668183.tmpdir/resources_1458303603.xml
--uuid=2ed20e6a-9f02-49ff-a71c-e071ce35dacc
/apps/FILESPACE/pycompssfile arg1 arg2 : -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh
/apps/INTEL/mkl/lib/intel64 null
/home/myhome/kmeans_python/src/ true
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 1
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc : -n 1 -H s00r0
/apps/COMPSs/1.3/Runtime/scripts/system/adaptors/nio/persistent_worker_starter.sh
/apps/INTEL/mkl/lib/intel64 null
/home/myhome/kmeans_python/src/ true
/tmp/1668183.tmpdir 4 5 5 s00r0-ib0 43001 43000 true 2
/apps/COMPSs/1.3/Runtime/scripts/system/2ed20e6a-9f02-49ff-a71c-e071ce35dacc

--------------------------------------------------------------------------
All nodes which are allocated for this job are already filled.
--------------------------------------------------------------------------
Run Code Online (Sandbox Code Playgroud)

我正在使用COMPS 1.3.

为什么会这样?

COM*_*lar 5

您正在尝试在同一节点中运行master和worker.具有NIO适配器的群集中的COMPS 1.3(默认选项)使用mpirun在群集的不同节点中生成主进程和工作进程,并且群集中安装的mpirun不允许执行此操作.

解决它的选项如下:

  1. 您没有在enqueue_compss命令中指定--tasks_in_master =.
  2. 你用GAT Adapter(--comm = integratedtoolkit.gat.master.GATAdaptor)执行,它有更多的开销

下一个COMPSs软件版本将使用spawn命令,该命令在不同的群集资源管理器(例如blaunch,srun)中可用,这必须解决此问题

  • 完善!我用GAT适配器解决了我的问题.但是,由于我了解NIO适配器的效率更高,因此我会在下一个版本发布后立即更新COMPS.感谢您快速准确的回复. (2认同)