Pat*_*ick 4 fortran blas
我在Fortran 77中整理了一些科学代码,我正在讨论什么会更快.
基本上,我有一个MxN矩阵,让我们称它为A. M大于N.后来在代码中,我需要乘以一堆向量转置(A).
我的问题是,采取A,自己转置并存储它会更快,或者当我调用BLAS时,只需给它转置标志?
谢谢!-Patrick
Any*_*orn 6
我的直觉告诉我使用转置标志.在这种情况下,你做了大量的点数产品.
实际上,没有实际运行代码就很难分辨.现代blas采用高速缓存阻塞技术,这使得简单分析最多变得困难.
归档时间:
15 年 前
查看次数:
1463 次
最近记录: