GPU上的整数计算

gsp*_*spr 18 optimization performance integer gpgpu

对于我的工作来说,进行整数计算特别有趣,这显然不是GPU的用途.我的问题是:现代GPU是否支持高效的整数运算?我意识到这应该很容易为自己弄清楚,但我发现相互矛盾的答案(例如),所以我认为最好问.

另外,GPU上有任意精度整数的库/技术吗?

jop*_*rat 14

首先,您需要考虑您正在使用的硬件:GPU设备性能在构造函数与另一个构建函数之间存在很大差异.
其次,它还取决于所考虑的操作:例如,添加可能比乘法更快.

就我而言,我只使用NVIDIA设备.对于这种硬件:官方文档宣布了32位整数和32位单精度浮点数与新架构(Fermi)的等效性能.以前的架构(Tesla)曾经为32位整数和浮点数提供相同的性能,但仅在考虑添加和逻辑运算时才提供.

但是,根据您使用的设备和说明,这可能不是真的.

  • 我想要注意的一件事是,是的,几乎对于所有体系结构,GPU上的所有CUDA内核都可以用于整数运算,但是没有用于整数的融合乘加运算,因此每秒的峰值整数运算仅为峰值的一半。襟翼。 (2认同)