BLAS相当于GPU的LAPACK功能

Ope*_*way 4 cuda gpu blas opencl lapack

在LAPACK中,有这种对角化功能

  SUBROUTINE DSPGVX( ITYPE, JOBZ, RANGE, UPLO, N, AP, BP, VL, VU,
 $                   IL, IU, ABSTOL, M, W, Z, LDZ, WORK, IWORK,
 $                   IFAIL, INFO )
Run Code Online (Sandbox Code Playgroud)

*

我正在寻找它的GPU实现.我试图找出这个函数是否已经在CUDA(或OpenCL)中实现,但只发现了CULA,它不是开源的.

因此,存在侧面CUBLAS,我想知道如何知道该子例程的BLAS或CUBLAS等效项是否可用.

tal*_*ies 12

BLAS不包括特征值求解器,CUBLAS在这方面也没有区别.UTK开发的Magma库包括几个GPU加速特征值问题例程.我不认为xSPGV是实现的,但其他几个是.根据矩阵的特性,可能会有一些东西可以使用.