通过MPI发送和接收2D阵列

Ash*_*han 21 c++ 2d mpi multidimensional-array

我想解决的问题如下:

我已经在大型2D矩阵中计算了C++序列码.为了优化这个过程,我希望拆分这个大的2D矩阵并使用MPI在4个节点上运行.节点之间发生的唯一通信是在每个时间步的末尾共享边缘值.每个节点与其邻居共享边缘阵列数据A [i] [j].

根据有关MPI的阅读,我有以下方案要实施.

if (myrank == 0)
{
 for (i= 0 to x)
 for (y= 0 to y)
 {
  C++ CODE IMPLEMENTATION 
  .... 
  MPI_SEND(A[x][0], A[x][1], A[x][2], Destination= 1.....)
  MPI_RECEIVE(B[0][0], B[0][1]......Sender = 1.....)
  MPI_BARRIER
}

if (myrank == 1)
{
for (i = x+1 to xx)
for (y = 0 to y)
{
 C++ CODE IMPLEMENTATION
 ....
 MPI_SEND(B[x][0], B[x][1], B[x][2], Destination= 0.....)
 MPI_RECEIVE(A[0][0], A[0][1]......Sender = 1.....)
 MPI BARRIER
}
Run Code Online (Sandbox Code Playgroud)

我想知道我的方法是否正确,并且也希望其他MPI函数的任何指导也可以用于实现.

谢谢,阿什温.

Jon*_*rsi 34

只是为了放大乔尔的观点:

如果你分配你的数组使它们连续(C的"多维数组"不会自动给你:)这会更容易:)

int **alloc_2d_int(int rows, int cols) {
    int *data = (int *)malloc(rows*cols*sizeof(int));
    int **array= (int **)malloc(rows*sizeof(int*));
    for (int i=0; i<rows; i++)
        array[i] = &(data[cols*i]);

    return array;
}

/*...*/
int **A;
/*...*/
A = alloc_2d_init(N,M);
Run Code Online (Sandbox Code Playgroud)

然后,您可以使用发送和接收整个NxM阵列

MPI_Send(&(A[0][0]), N*M, MPI_INT, destination, tag, MPI_COMM_WORLD);
Run Code Online (Sandbox Code Playgroud)

当你完成后,释放内存

free(A[0]);
free(A);
Run Code Online (Sandbox Code Playgroud)

此外,MPI_Recv是阻止接收,并MPI_Send可以阻止发送.根据乔尔的观点,有一点意味着你绝对不需要障碍.此外,这意味着如果你有一个如上所述的发送/接收模式,你可以让自己陷入僵局 - 每个人都在发送,没有人接受.更安全的是:

if (myrank == 0) {
   MPI_Send(&(A[0][0]), N*M, MPI_INT, 1, tagA, MPI_COMM_WORLD);
   MPI_Recv(&(B[0][0]), N*M, MPI_INT, 1, tagB, MPI_COMM_WORLD, &status);
} else if (myrank == 1) {
   MPI_Recv(&(A[0][0]), N*M, MPI_INT, 0, tagA, MPI_COMM_WORLD, &status);
   MPI_Send(&(B[0][0]), N*M, MPI_INT, 0, tagB, MPI_COMM_WORLD);
}
Run Code Online (Sandbox Code Playgroud)

另一种更通用的方法是使用MPI_Sendrecv:

int *sendptr, *recvptr;
int neigh = MPI_PROC_NULL;

if (myrank == 0) {
   sendptr = &(A[0][0]);
   recvptr = &(B[0][0]);
   neigh = 1;
} else {
   sendptr = &(B[0][0]);
   recvptr = &(A[0][0]);
   neigh = 0;
}
MPI_Sendrecv(sendptr, N*M, MPI_INT, neigh, tagA, recvptr, N*M, MPI_INT, neigh, tagB, MPI_COMM_WORLD, &status);
Run Code Online (Sandbox Code Playgroud)

或非阻塞发送和/或接收.

  • C的多维数组是一个连续的内存块; 如果你分配`double d [50] [50];`,那是一个连续的内存块.处理动态分配的"伪2D"数组的一种方法是分配一大块指针和一组独立的(通常是不连续的)内存块,每行一个.请参阅[使用`malloc`时C如何为2D(3D ...)数组分配空间的讨论?](http://stackoverflow.com/questions/17584215/how-does-c-allocate-space-对于-A-2D-3D-阵列时-使用-的malloc/17584424#17584424) (2认同)