Tit*_*tzi 5 c++ parallel-processing performance memory-management numa
是否有一种方便有效的方式以NUMA识别方式使用cpp标准容器API?
我想在cpp环境中进行OpenMP并行稀疏矩阵向量乘法.要分配和初始化关于NUMA域的向量和矩阵值,C代码将以某种方式看起来像这样:
size_t N = 1000000;
double* vecVal = malloc (N*sizeof(double));
#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
vecVal[i] = 0.;
}
/* do spMV */
delete vecVal;
Run Code Online (Sandbox Code Playgroud)
在Cpp中我想使用std :: vector(具有固定大小的std :: array也可以).std :: vector :: reserve()可以做到吗?做这样的事情是合法的:
std::vector<double> vec;
vec.reserve(N);
double *vecVal = vec.data();
#pragma OMP parallel for
for (size_i=0; i<N; ++i)
{
vecVal[i] = 0.;
}
/* do spMV */
Run Code Online (Sandbox Code Playgroud)
我怎样才能在std :: vector中设置正确的大小?
有谁知道更优雅的方式?
小智 5
您必须在这里使用特殊的 numa 感知分配器。我们在这里为 HPX 实现了类似的东西: https: //github.com/STEllAR-GROUP/hpx/blob/master/hpx/parallel/util/numa_allocator.hpp
基本思想是首先接触分配器内部的 allocate 函数。用你的循环替换 HPX 执行器的东西#omp parallel for schedule(static),你应该没问题。
| 归档时间: |
|
| 查看次数: |
527 次 |
| 最近记录: |