Ope*_*way 6 c++ cuda gpgpu linear-algebra
在一些代码中,我们需要获得具有对称实矩阵(Ax = lamba Bx)的广义特征值问题的自动向量和自动值.此代码使用LACPACK中的DSPGVX.我们希望使用MAGMA功能在GPU上加速.我们在这个论坛上询问并得到了关于此的答案
http://icl.cs.utk.edu/magma/docs/zhegvx_8cpp.html
我们的矩阵(N)的大小从100到50000甚至更多,与分子中的原子数有关.我们观察到:
a)对于大于2500(大约)的N,MAGMA不起作用; 分段错误b)MAGMA运行总是比LAPACK顺序慢,大约慢10倍
这种行为是否正常,我们可以克服它吗?任何人都可以报告任何参与此类问题的人获得体面加速的情况吗?
谢谢
| 归档时间: |
|
| 查看次数: |
2575 次 |
| 最近记录: |