为什么数学库经常被FLOPS比较？

在某些情况下，每个库将执行相同数量的浮点运算的假设是合理的。但完全有可能两个库对于同一任务（例如矩阵矩阵乘法）需要不同数量的浮点运算。如果是这种情况，那么与执行更多 FLOPS 的库相比，一个库执行的 FLOPS 可能更少，但完成时间更短。因此，在这些情况下，总运行时间是合理的。如果作者以 FLOPS 为单位发布比较结果，则意味着他们相信每个库总共执行的操作次数相同；或者只是将理论上完成任务所需的操作数除以总运行时间（这也很常见）。您需要检查基准测试方法。

比较性能（例如 FLOPS）与大小的目的是帮助人们了解其用例的代表性输入的性能。如果您知道您将有很多小向量，例如小于 10 的向量，那么您并不关心该库对于大小为 1gb 的向量的速度有多快，并且不希望这些输入影响比较。

一般来说，计算 FLOPS 很流行（部分原因可能是因为它很容易向数学家解释）。我认为一个动机是，说“你可以以 10000 FLOPS 的速度出售 size=10 的向量，但以 100 FLOPS 的速度出售 size=100 的向量”比说“你可以在 0.001 秒内缩放 size=10 的向量，但大小为 100 FLOPS”更容易消化。 = 1 秒内 100 个向量。” 如果您报告总运行时间，您可能需要按输入大小进行缩放以进行比较。

归档时间：	10 年，6 月前
查看次数：	164 次
最近记录：	10 年，6 月前