小编Hua*_*ong的帖子

使用OpenMP和Block方法加速矩阵乘法:我能做得更好吗?

这是我写的代码:

#include <omp.h>
void matrix_multi(int c[][TSIZE], int a[][TSIZE], int b[][TSIZE])
{
   int B=8;

  int i, j, k,i1,j1,k1;
#pragma omp parallel for private(i,j,k,i1,j1,k1) schedule(auto) collapse(3)
  for (i=0; i<TSIZE; i+=B)
    for (j=0; j<TSIZE; j+=B)
      for (k=0; k<TSIZE; k+=B)
        for (i1=i;i1<i+B;i1++)
          for (j1=j;j1<j+B;j1++)
            {
              int sum=0;
              for (k1=k;k1<k+B;k1++)
                {
                  sum+=a[i1][k1]*b[k1][j1];
                }
              c[i1][j1]+=sum;
            }

}
Run Code Online (Sandbox Code Playgroud)

我的问题是:我可以通过对三个内循环的进一步操作来获得更好的性能吗?

c parallel-processing openmp matrix-multiplication

6
推荐指数
1
解决办法
799
查看次数