我试图使用OpenCL加速一些计算,部分算法包括反转矩阵.是否有任何开源库或免费提供的代码来计算用OpenCL或CUDA编写的矩阵或一般反演的lu分解(lapack dgetrf和dgetri)?矩阵是实数和正方形,但除此之外没有任何其他特殊属性.到目前为止,我已经设法在gpu上找到了基本的blas矩阵向量运算实现.
矩阵相当小,只有大约60-100行和cols,所以它可以在cpu上更快地计算,但它在算法的中间使用,所以我必须将它转移到主机,计算逆,和然后将结果传回设备,然后在更大的计算中使用它.