我对测量触发器有一些误解,在英特尔架构上,是一个FLOP一个加法和一个乘法?我在网上的某处读过这篇文章,没有任何辩论可以拒绝这一点.我知道FLOP在不同类型的cpu上有不同的含义.
如何计算理论峰值FLOPS?我正在使用Intel(R)Core(TM)2 Duo CPU E7400 @ 2.80GHz.GHz和FLOPS之间究竟有什么关系?(甚至维基百科在FLOPS上的条目也没有具体说明如何做到这一点)
我将使用以下方法来测量我的计算机的实际性能(就翻牌而言):两个向量的内积:对于两个大小为N的向量,是翻牌数2n(n-1)(如果一个加法)或者一次乘法被认为是1次翻牌).如果没有,我该如何计算呢?
我知道有更好的方法可以这样做,但我想知道我提出的计算是否正确.我在某处读到LINPACK作为基准,但我仍然想知道它是如何完成的.
我一直在关注OpenCL的一些教程,很多时候人们都在谈论FLOPS.维基百科确实解释了这个公式,但没有告诉它实际意味着什么?例如,1光年= 9.4605284×10 ^ 15米,但这意味着光在一年中行进的距离.同样,FLOP是什么意思? 答到类似的问题,说100次IOPS的代码
for(int i = 0; i < 100; ++i)
Run Code Online (Sandbox Code Playgroud)
忽略初始化,我看到100个增量操作,所以有100个IOPS.但我也看到了100个比较操作.那么为什么不是200IOPS呢?那么FLOPS/IOPS计算中包含哪些类型的运算符?
其次,我想知道通过计算算法的FLOPS你会做什么?我问这个是因为该值特定于CPU时钟速度而没有内核.对这个领域的任何指导都会非常有帮助.