BLAS 库基准

Ste*_*der 4 benchmarking multicore blas

是否有比较不同 BLAS(基本线性代数子程序)库的基准?我对单核和多核系统的稀疏矩阵乘法特别感兴趣?

jdi*_*isk 6

BLAS 性能在很大程度上取决于系统,因此您最好在要使用的机器上自己进行基准测试。因为只有少数 BLAS 实现,所以工作量比听起来要少(通常是硬件供应商的实现ATLASGOTO BLAS)。

但请注意,BLAS 仅涵盖密集矩阵,因此对于稀疏矩阵乘法,您将需要 Sparse-BLAS 或其他一些代码。这里的性能不仅取决于硬件,还取决于您要使用的稀疏格式,甚至取决于您正在使用的矩阵类型(稀疏模式、带宽等很重要)。因此,与密集情况相比,如果您需要最高性能,则需要进行自己的基准测试。