clBLAS和ViennaCL之间的差异?

cde*_*man 8 gpgpu opencl viennacl

看看OpenCL库,我试图完全掌握每一个.一个库特别是clBLAS.他们的网站声称它实施了BLAS 1,2和3级方法.这很好但是ViennaCL还有BLAS例程,线性代数求解器,支持OpenCL和CUDA后端,并且只是标题.在我看来,目前似乎没有理由使用clBLAS而不是ViennaCL,但我想知道是否有人有理由为什么会使用clBLAS而不是ViennaCL

虽然类似,但这是比较VexCL,Thrust和Boost.Compute的前一个问题的扩展.

dde*_*dov 3

clBlas 是由 AMD 实现的,因此人们可以希望它在 AMD 硬件上会更快。这通常是供应商 BLAS 实现的唯一优势。不幸的是,这里的情况似乎并非如此。

本次演讲中,ViennaCL 作者报告说,由于他们的自动调整框架,他们能够超越 clBLAS,或者表现出类似的性能。