并行化因子计算

fer*_*rer 6 c parallel-processing openmp factorial

我想编写一个使用并行计算(Open MP 库)计算整数阶乘的程序。

显然,下面的程序存在竞争条件。

// Each loop iteration writes a value that a different iteration reads.
#pragma omp parallel for
for (i=2; i < 10; i++)
{
   factorial[i] = i * factorial[i-1];
}
Run Code Online (Sandbox Code Playgroud)

我在某处读到 pow 和阶乘计算绝不能并行完成。那么,这是真的,还是可以修改上述程序(在 C 中,使用 OPenMP 库)以并行计算阶乘?

Z b*_*son 4

您可以通过运行数组两次来并行执行此操作。第一次计算部分积并保存每个线程的总部分积。在第二遍中,您将根据前一个线程的总乘积更正每个元素。这类似于如何并行执行累积和(也称为前缀和),只不过它是并行的累积乘积。

#include <stdio.h>
#include <stdlib.h>
#include <omp.h>

int main(void) {
    int n = 10;
    int factorial[n];
    factorial[1] = 1;

    int *proda;
    #pragma omp parallel
    {
        int ithread = omp_get_thread_num();
        int nthreads = omp_get_num_threads();
        #pragma omp single
        {
            proda = malloc(nthreads * sizeof *proda);
            proda[0] = 1;
        }
        int prod = 1;
        #pragma omp for schedule(static) nowait
        for (int i=2; i<n; i++) {
            prod *= i;
            factorial[i] = prod;
        }
        proda[ithread+1] = prod;
        #pragma omp barrier
        int offset = 1;
        for(int i=0; i<(ithread+1); i++) offset *= proda[i];
        #pragma omp for schedule(static)
        for(int i=1; i<n; i++) factorial[i] *= offset;
    }
    free(proda);

    for(int i=1; i<n; i++) printf("%d\n", factorial[i]); putchar('\n'); 
}
Run Code Online (Sandbox Code Playgroud)