如何获取MPI中的物理机数量

nil*_*ile 5 c fortran mpi

我可以MPI_Comm_size用来获得总处理器的数量.但是如何才能获得真实物理机的数量呢?

Hri*_*iev 7

如果物理机器是指一组处理元素,共享一个公共内存地址空间,那么MPI-3按类型拆分操作MPI_COMM_SPLIT_TYPE可用于移植获取此类机器的数量:

int getNodeCount(void)
{
   int rank, is_rank0, nodes;
   MPI_Comm shmcomm;

   MPI_Comm_split_type(MPI_COMM_WORLD, MPI_COMM_TYPE_SHARED, 0,
                       MPI_INFO_NULL, &shmcomm);
   MPI_Comm_rank(shmcomm, &rank);
   is_rank0 = (rank == 0) ? 1 : 0;
   MPI_Allreduce(&is_rank0, &nodes, 1, MPI_INT, MPI_SUM, MPI_COMM_WORLD);
   MPI_Comm_free(&shmcomm);
   return nodes;
}
Run Code Online (Sandbox Code Playgroud)

在Fortran:

subroutine getNodeCount(count)
  use mpi
  implicit none
  integer, intent(out) :: count
  integer :: shmcomm, rank, is_rank0, ierr

  call MPI_COMM_SPLIT_TYPE(MPI_COMM_WORLD, MPI_COMM_TYPE_SHARED, 0, &
                           MPI_INFO_NULL, shmcomm, ierr)
  call MPI_COMM_RANK(shmcomm, rank, ierr)
  if (rank == 0) then
     is_rank0 = 1
  else
     is_rank0 = 0
  end if
  call MPI_ALLREDUCE(is_rank0, count, 1, MPI_INTEGER, MPI_SUM, &
                     MPI_COMM_WORLD, ierr)
  call MPI_COMM_FREE(shmcomm, ierr)
end subroutine getNodeCount
Run Code Online (Sandbox Code Playgroud)

该函数首先将世界通信器分成能够创建共享存储器区域的组,即每个物理机器一组(给出上面的定义).然后,它通过对rank-0实体的数量求和来计算这些组的数量.由于使用集体操作,该功能必须由世界组中的所有等级调用.

免责声明:未经测试的代码 - 使用风险由您自行承担.


Gil*_*les 1

像这样的小函数(未经测试,因此可能需要调整)应该可以做到这一点。它依赖于MPI_get_processor_name()每个计算节点返回一个唯一的字符串。

int getNodesNumer() {
    int rank, size;
    MPI_Comm_rank( MPI_COMM_WORLD, &rank );
    MPI_Comm_size( MPI_COMM_WORLD, &size );
    char names[size][MPI_MAX_PROCESSOR_NAME];
    int len;
    MPI_Get_processor_name( names[rank], &len );
    MPI_Allgather( MPI_IN_PLACE, 0, 0, names[0], MPI_MAX_PROCESSOR_NAME, MPI_CHAR, MPI_COMM_WORLD );
    int indexes[size];
    int count = 0;
    for ( int i = 0; i < size; i++ ) {
        int found = 0;
        for ( int j = 0; j < count; j++ ) {
            if ( strncmp( names[i], names[indexes[j]], MPI_MAX_PROCESSOR_NAME ) == 0 ) {
                found = 1;
                break;
            }
        }
        if ( found == 0 ) {
            indexes[count++] = i;
        }
    }
    return count;
}
Run Code Online (Sandbox Code Playgroud)