小编Cai*_*ian的帖子

多线程的内存注意事项

我正在 C/C++ 上实现 am 算法来处理一些向量,我认为使它并行可能是一个好主意,因为我正在使用多核 CPU。我对 GPGPU 有一些经验,内存访问不好会破坏整个性能,我是否还需要考虑 CPU 内核之间的任何特殊访问布局?

谢谢

c++ memory cpu performance multithreading

3
推荐指数
1
解决办法
1094
查看次数

完全禁用NVCC上的优化

我正在尝试测量GPU上的峰值单精度触发器,因为我正在修改PTX文件以在寄存器上执行连续的MAD指令.不幸的是,编译器正在删除所有代码,因为它实际上没有任何用处,因为我不执行任何数据的加载/存储.是否有编译器标志或编译指示添加到代码中,因此编译器不会触及它?

谢谢.

optimization cuda gpu nvcc

3
推荐指数
2
解决办法
4256
查看次数

使用 Eigen 3 线性系统求解器得到错误结果

我正在使用 Eigen 3 将 MATLAB 代码移植到 C++,并决定构建线性求解器,而不是从矩阵对象中调用它,这样我就可以重用它。不幸的是,它没有产生预期的结果。经过几次测试后,我将问题追溯到似乎是线性求解器对象,如以下相关代码片段所示:

MatrixXcd M(6,6), Y(6,6), dvalor(6,6);
// Initialization of the matrices...

FullPivHouseholderQR<MatrixXcd> mdivide;

auto result = mldivide.compute(Y).solve(M).eval() *
    dvalor * mldivide.compute(M).solve(Y).eval();

std::cout << "result:" << std::endl
    << result << std::endl << std::endl;

std::cout << "using fullPivHouseholderQr:" << std::endl
    << Y.fullPivHouseholderQr().solve(M) * dvalor *
    M.fullPivHouseholderQr().solve(Y) << std::endl << std::endl;

std::cout << "using jacobi:" << std::endl
    << Y.jacobiSvd(ComputeThinU | ComputeThinV).solve(M) * dvalor *
    M.jacobiSvd(ComputeThinU | ComputeThinV).solve(Y) << std::endl << std::endl;

std::cout << "using inverse:" << std::endl
    << …
Run Code Online (Sandbox Code Playgroud)

c++ linear-algebra eigen eigen3

3
推荐指数
1
解决办法
764
查看次数

ATLAS的未定义引用

我试图在我的项目中使用ATLAS,但我无法将最简单的代码链接到它:

#include <stdio.h>
#include <cblas.h>

void ATL_buildinfo(void);

int main() {
    ATL_buildinfo();
    return 0;
}
Run Code Online (Sandbox Code Playgroud)

我正在编译:

gcc -I/home/caian/ATLAS/include/ \
  -I/home/caian/ATLAS/ARCH/include/ \
  -L/home/caian/ATLAS/ARCH/lib/ \
  -latlas main.c -o test
Run Code Online (Sandbox Code Playgroud)

我仔细检查了ATL_buildinfo原型和libatlas.a,nm显示ATL_buildinfo存在.

可能是什么问题呢?

linker gcc atlas

2
推荐指数
1
解决办法
468
查看次数

如何从NVidia Visual Profiler(nvvp)导出数据?

我有一个奇怪的时间从我在Linux上的应用程序的分析代码中读取,所以我决定通过NVidia Visual Profiler运行它.然而,在工具包4.1上,他们决定删除Compute Visual Profiler以引入nvvp.我需要处理程序之外的数据,nvvp不能做的是平均值,偏差,置信度和大量统计数据.问题是nvvp中没有导出功能,Compute Visual Profiler至少可以让你导出到CSV.是否有解决方案而不是安装4.0工具包?

谢谢

profiling nvidia

1
推荐指数
1
解决办法
2078
查看次数