在BLAS中移植还是先自己做?

Pat*_*ick 4 fortran blas

我在Fortran 77中整理了一些科学代码,我正在讨论什么会更快.

基本上,我有一个MxN矩阵,让我们称它为A. M大于N.后来在代码中,我需要乘以一堆向量转置(A).

我的问题是,采取A,自己转置并存储它会更快,或者当我调用BLAS时,只需给它转置标志?

谢谢!-Patrick

Any*_*orn 6

我的直觉告诉我使用转置标志.在这种情况下,你做了大量的点数产品.

实际上,没有实际运行代码就很难分辨.现代blas采用高速缓存阻塞技术,这使得简单分析最多变得困难.