Ste*_*der 4 benchmarking multicore blas
是否有比较不同 BLAS(基本线性代数子程序)库的基准?我对单核和多核系统的稀疏矩阵乘法特别感兴趣?
jdi*_*isk 6
BLAS 性能在很大程度上取决于系统,因此您最好在要使用的机器上自己进行基准测试。因为只有少数 BLAS 实现,所以工作量比听起来要少(通常是硬件供应商的实现,ATLAS和GOTO BLAS)。
但请注意,BLAS 仅涵盖密集矩阵,因此对于稀疏矩阵乘法,您将需要 Sparse-BLAS 或其他一些代码。这里的性能不仅取决于硬件,还取决于您要使用的稀疏格式,甚至取决于您正在使用的矩阵类型(稀疏模式、带宽等很重要)。因此,与密集情况相比,如果您需要最高性能,则需要进行自己的基准测试。
归档时间:
17 年,1 月 前
查看次数:
1836 次
最近记录:
4 年,10 月 前