看看OpenCL库,我试图完全掌握每一个.一个库特别是clBLAS.他们的网站声称它实施了BLAS 1,2和3级方法.这很好但是ViennaCL还有BLAS例程,线性代数求解器,支持OpenCL和CUDA后端,并且只是标题.在我看来,目前似乎没有理由使用clBLAS而不是ViennaCL,但我想知道是否有人有理由为什么会使用clBLAS而不是ViennaCL?
虽然类似,但这是比较VexCL,Thrust和Boost.Compute的前一个问题的扩展.
gpgpu opencl viennacl
我知道有一个openCL C++ API,但是我在编译内核时遇到了麻烦......内核是否必须用C语言编写?然后它只是允许用C++编写的主机代码?或者有没有办法在C++中编写我没有找到的内核?具体来说,我正在尝试使用pyopencl编译我的内核,它似乎失败了,因为它将它们编译为C代码.
c++ gpgpu opencl pyopencl
我正在将CUDA代码移植到OpenCL - CUDA允许C++构造像模板,而OpenCL严格来说是C99.那么,将templatest移植到C的最无痛的方法是什么?我想过为模板参数使用函数指针.
templates cuda opencl
opencl ×3
gpgpu ×2
c++ ×1
cuda ×1
pyopencl ×1
templates ×1
viennacl ×1