部分和任务openmp之间的区别

Ark*_*one 48 c parallel-processing openmp

OpenMP之间的区别是什么:

#pragma omp parallel sections
{
    #pragma omp section
    {
       fct1();
    }
    #pragma omp section
    {
       fct2();
    }
}
Run Code Online (Sandbox Code Playgroud)

并且:

#pragma omp parallel 
{
    #pragma omp single
    {
       #pragma omp task
       fct1();
       #pragma omp task
       fct2();
    }
}
Run Code Online (Sandbox Code Playgroud)

我不确定第二个代码是否正确......

Hri*_*iev 124

任务和部分之间的区别在于代码执行的时间范围.部分包含在sections构造中,并且(除非nowait指定了子句)线程将不会离开它,直到所有部分都被执行:

                 [    sections     ]
Thread 0: -------< section 1 >---->*------
Thread 1: -------< section 2      >*------
Thread 2: ------------------------>*------
...                                *
Thread N-1: ---------------------->*------
Run Code Online (Sandbox Code Playgroud)

这里的N线程遇到一个sections带有两个部分的构造,第二个部分比第一个花费更多的时间.前两个线程各执行一个部分.其他N-2线程只是在sections结构末尾的隐式屏障处等待(在此处显示为*).

任务在所谓的任务调度点处尽可能排队并执行.在某些情况下,可以允许运行时在线程之间移动任务,即使在它们的生命周期中也是如此.这些任务被称为解开,一个解开的任务可能会在一个线程中开始执行,然后在某个调度点,它可能会被运行时迁移到另一个线程.

但是,任务和部分在很多方面都是相似的.例如,以下两个代码片段实现了基本相同的结果:

// sections
...
#pragma omp sections
{
   #pragma omp section
   foo();
   #pragma omp section
   bar();
}
...

// tasks
...
#pragma omp single nowait
{
   #pragma omp task
   foo();
   #pragma omp task
   bar();
}
#pragma omp taskwait
...
Run Code Online (Sandbox Code Playgroud)

taskwait非常barrier适合但是对于任务 - 它确保当前执行流程将暂停,直到所有排队的任务都已执行.它是一个调度点,即它允许线程处理任务.在single需要构建,使任务将仅由一个线程创建.如果没有single构造,则每个任务都会创建num_threads时间,这可能不是人们想要的.构造中的nowait子句single指示其他线程不等待single构造执行(即移除single构造末尾的隐式屏障).所以他们taskwait立即点击并开始处理任务.

taskwait是为了清楚起见,这里显示的显式调度点.还有隐式调度点,最明显的是在屏障同步内部,无论是显式还是隐式.因此,上面的代码也可以简单地写成:

// tasks
...
#pragma omp single
{
   #pragma omp task
   foo();
   #pragma omp task
   bar();
}
...
Run Code Online (Sandbox Code Playgroud)

这是一个可能的场景,如果有三个线程可能会发生什么:

               +--+-->[ task queue ]--+
               |  |                   |
               |  |       +-----------+
               |  |       |
Thread 0: --< single >-|  v  |-----
Thread 1: -------->|< foo() >|-----
Thread 2: -------->|< bar() >|-----
Run Code Online (Sandbox Code Playgroud)

在此处显示的| ... |是调度点的操作(taskwait指令或隐式屏障).基本上是线程12暂停它们正在执行的操作并从队列中开始处理任务.处理完所有任务后,线程将恢复正常的执行流程.注意,线程12线程之前可能到达调度点0已经离开single构建体,所以左侧|的需要不是必须被对准(这是上述表示在图上).

也许线程1能够完成处理foo()任务并在其他线程能够请求任务之前请求另一个任务.所以这两个foo()并且bar()可能由同一个线程执行:

               +--+-->[ task queue ]--+
               |  |                   |
               |  |      +------------+
               |  |      |
Thread 0: --< single >-| v             |---
Thread 1: --------->|< foo() >< bar() >|---
Thread 2: --------------------->|      |---
Run Code Online (Sandbox Code Playgroud)

如果线程2来得太晚,单挑线程也可能执行第二个任务:

               +--+-->[ task queue ]--+
               |  |                   |
               |  |      +------------+
               |  |      |
Thread 0: --< single >-| v < bar() >|---
Thread 1: --------->|< foo() >      |---
Thread 2: ----------------->|       |---
Run Code Online (Sandbox Code Playgroud)

在某些情况下,编译器或OpenMP运行时甚至可能完全绕过任务队列并按顺序执行任务:

Thread 0: --< single: foo(); bar() >*---
Thread 1: ------------------------->*---
Thread 2: ------------------------->*---
Run Code Online (Sandbox Code Playgroud)

如果区域代码中没有任何任务调度点,则OpenMP运行时可能会在其认为合适时启动任务.例如,可能延迟所有任务,直到parallel达到区域末端的屏障.

  • @JoeC,`sections`是一个工作共享构造,这意味着与给定并行区域相关联的团队中的所有线程必须遇到它才能使构造成功.如果不希望空闲线程在隐式屏障处等待,则应用`nowait`子句,这将删除隐式屏障. (2认同)