小编Lui*_*uiz的帖子

我的归并排序算法使用 OpenMP 时速度较慢,如何使其比序列化形式更快?

我正在研究并行编程并在排序算法上对其进行测试。我发现最简单的方法是使用 OpenMP,因为它提供了一种实现线程的简单方法。我做了研究,发现其他人已经这样做了,然后我尝试了一些代码。但是,当我perf stat -r 10 -d在 Linux 上测试它时,我得到的时间比序列化代码更糟糕(在某些情况下是两倍)。我尝试在数组上使用不同数量的元素,我使用的最大数量是 1.000.000 个数字,就好像我使用更多我收到错误一样。


void merge(int aux[], int left, int middle, int right){
    int temp[middle-left+1], temp2[right-middle];
    for(int i=0; i<(middle-left+1); i++){
        temp[i]=aux[left+i];
    }
    for(int i=0; i<(right-middle); i++){
        temp2[i]=aux[middle+1+i];
    }
    int i=0, j=0, k=left;
    while(i<(middle-left+1) && j<(right-middle))
    {
        if(temp[i]<temp2[j]){
            aux[k++]=temp[i++];
        }
        else{
            aux[k++]=temp2[j++];
        }
    }
    while(i<(middle-left+1)){
        aux[k++]=temp[i++];
    }
    while(j<(right-middle)){
        aux[k++]=temp2[j++];
    }
}

void mergeSort (int aux[], int left, int right){
    if (left < right){
        int middle = (left + right)/2;
        omp_set_num_threads(2);
        #pragma omp parallel …
Run Code Online (Sandbox Code Playgroud)

c++ parallel-processing mergesort openmp

5
推荐指数
1
解决办法
478
查看次数

标签 统计

c++ ×1

mergesort ×1

openmp ×1

parallel-processing ×1