我正在CUDA中编写一个程序,该程序sincos()
使用双精度对函数进行了大量调用。恐怕这是代码的最大瓶颈之一,而且我无法减少对该函数的调用次数。
sincos
我可以导入的CUDA或库中是否有任何近似的近似值?我也非常关注准确性,因此近似值越好,我的代码就会越快乐。
我也曾考虑过要建立一个查找表或使用taylor系列来近似这些值,但是在寻求这条路之前,我需要一些意见。
CUDA数学api中sincos
提供了相当快速而准确的功能。只要包括。或者,如果适合您,请使用(这里)。(我知道您在问题中说的是双精度。只是指出一些要点。)math.h
sincosf
如果您可以使用sincospif
代替sincosf
@ njuffa,@ njuffa在这里发挥了他的魔力,这可能会让您感兴趣。