我在Fortran 77中整理了一些科学代码,我正在讨论什么会更快.
基本上,我有一个MxN矩阵,让我们称它为A. M大于N.后来在代码中,我需要乘以一堆向量转置(A).
我的问题是,采取A,自己转置并存储它会更快,或者当我调用BLAS时,只需给它转置标志?
谢谢!-Patrick
fortran blas
blas ×1
fortran ×1