并行多个嵌套循环与tbb

use*_*182 8 c++ tbb

使用tbb并行三个嵌套独立循环的最佳方法是什么?

for(int i=0; i<100; i++){
    for(int j=0; j<100; j++){
        for(int k=0; k<100; k++){
            printf("Hello World \n");
        }
     }
 }
Run Code Online (Sandbox Code Playgroud)

Ant*_*ton 13

TBB中的嵌套循环基本上有两种方式.

  1. 由于TBB旨在完美支持嵌套并行性,因此只需编写嵌套并行fors:

    tbb::parallel_for(0, 100, [](int i){
        tbb::parallel_for(0, 100, [](int j){
            tbb::parallel_for(0, 100, [](int k){
                printf("Hello World %d/%d/%d\n", i, j, k);
            });
        });
    });
    
    Run Code Online (Sandbox Code Playgroud)

    当循环属于不同的模块或/和库时,此变体很有效.

  2. 否则,使用blocked_range2d或折叠两个或三个嵌套循环blocked_range3d.它还可以帮助优化缓存局部性,从而在访问数组时甚至在单个线程上提高性能:

    tbb::parallel_for( tbb::blocked_range3d<int>(0, 100, 0, 100, 0, 100),
        []( const tbb::blocked_range3d<int> &r ) {
            for(int i=r.pages().begin(), i_end=r.pages().end(); i<i_end; i++){
                for(int j=r.rows().begin(), j_end=r.rows().end(); j<j_end; j++){
                    for(int k=r.cols().begin(), k_end=r.cols().end(); k<k_end; k++){
                        printf("Hello World %d\n", matrix3d[i][j][k]);
                    }
                }
            }
    });
    
    Run Code Online (Sandbox Code Playgroud)

  • 谢谢!我跑了他们两个,确实第二个有更好的表现. (2认同)