什么是并行 for 循环,应该如何/何时使用它?

Noa*_*oth 4 c++ parallel-processing multithreading

我已经用 C++ 编码多年,过去我使用过线程,但我现在才开始学习多线程编程及其实际工作原理。

到目前为止,我在理解这些概念方面做得还不错,但是有一件事让我感到困惑。

  • 什么是并行 for 循环,它们是如何工作的?
  • 任何 for 循环都可以并行吗?
  • 他们有什么用?表现?
  • 其他功能?

我在网上找不到任何足以让我理解的内容。

我用 C++ 编写代码,但我确信这个问题适用于许多不同的编程语言。

Tho*_*ews 6

什么是并行 for 循环,它们是如何工作的?

for循环并行是一个for其中在所述循环中的语句可以并行运行的循环:在单独的核,处理器或线程。

让我们取一个求和代码:

unsigned int numbers[] = { 1, 2, 3, 4, 5, 6};
unsigned int sum = 0;
const unsigned int quantity = sizeof(numbers) / sizeof (numbers[0]);
for (unsigned int i = 0; i < quantity; ++i)
{
  sum = sum + numbers[i];
};
Run Code Online (Sandbox Code Playgroud)

计算总和不取决于顺序。总和只关心所有数字都已相加。

循环可以分成两个循环,由单独的线程或处理器执行:

// Even loop:
unsigned int even_sum = 0;
for (unsigned int e = 0; e < quantity; e += 2)
{
  even_sum += numbers[e];
}

// Odd summation loop:
unsigned int odd_sum = 0;
for (unsigned int odd = 1; odd < quantity; odd += 2)
{
  odd_sum += numbers[odd];
}

// Create the sum
sum = even_sum + odd_sum;
Run Code Online (Sandbox Code Playgroud)

甚至奇数求和回路是相互独立的。它们不访问任何相同的内存位置。

求和for循环可以被认为是一个并行的 for 循环,因为它的语句可以由单独的进程并行运行,例如单独的 CPU 内核。

其他人可以提供更详细的定义,但这是一般示例。

编辑1:

任何 for 循环都可以并行吗?

不,任何循环都不能并行。循环的迭代必须彼此独立。也就是说,一个 CPU 内核应该能够运行一次迭代,而不会对运行不同迭代的另一个 CPU 内核产生任何副作用。

他们有什么用?
表现?

一般来说,原因是性能。但是,设置循环的开销必须小于迭代的执行时间。此外,还有等待并行执行完成并将结果连接在一起的开销。

通常,数据移动和矩阵运算是并行化的良好候选者。例如,移动位图或对位图应用转换。海量数据需要他们可以获得的所有帮助。

其他功能?

是的,并行 for 循环还有其他可能的用途,例如同时更新多个硬件设备。但是,一般情况是为了提高数据处理性能。