在C++中最快的正弦,余弦和平方根的实现(不需要太精确)

Question

在C++中最快的正弦,余弦和平方根的实现(不需要太精确)

Pio*_*trK 34 c++ math optimization trigonometry

我正在谷歌搜索过去一小时的问题,但只有泰勒系列或一些示例代码的要点太慢或根本不编译.好吧,我发现谷歌的答案大多是"Google it,它已经被问到了",但遗憾的是它不是 ......

我在低端Pentium 4上分析我的游戏,发现大约85%的执行时间浪费在计算窦,cosinus和平方根(来自Visual Studio中的标准C++库)上,这似乎与CPU密切相关(在我的I7上,相同的功能只有5%的执行时间,并且游戏更快了waaaaaaaaaa).我不能优化这三个函数,也不能在一次传递中计算正弦和余弦(相互依赖),但我不需要太精确的模拟结果,所以我可以使用更快的逼近.

那么,问题是:在C++中计算float的正弦,余弦和平方根的最快方法是什么？

编辑查找表更加痛苦,因为在现代CPU上产生的Cache Miss比Taylor系列更昂贵.这些天CPU很快,而缓存则不然.

我犯了一个错误,我虽然需要为Taylor系列计算几个阶乘,我现在看到它们可以实现为常量.

所以更新的问题是:对于平方根还有任何快速优化吗？

EDIT2

我使用平方根计算距离,而不是规范化 - 不能使用快速反平方根算法(如评论中所指出:http://en.wikipedia.org/wiki/Fast_inverse_square_root

EDIT3

我也无法在平方距离上操作,我需要精确的距离进行计算

Answer 1

Viv*_*nda 40

首先,泰勒系列不是实现正弦/余弦的最佳/最快方式.它也不是专业库实现这些三角函数的方式,并且知道最佳数值实现允许您调整精度以更有效地获得速度.此外,StackOverflow中已经广泛讨论了这个问题.这只是一个例子.

其次,您在旧/新PCS之间看到的巨大差异是由于现代英特尔架构具有用于计算元素三角函数的显式汇编代码.在执行速度上击败他们是相当困难的.

最后,我们来谈谈旧PC上的代码.检查gsl gnu科学库 (或数值配方)的实现,你会发现他们基本上使用了Chebyshev近似公式.

切比雪夫逼近收敛速度更快,因此您需要评估更少的术语.我不会在这里编写实现细节,因为StackOverflow上已经发布了非常好的答案.例如,检查一下.只需调整此系列中的术语数量即可更改精度/速度之间的平衡.

顺便说一下:针对这类问题的规则0:如果你想要一些特殊函数或数值方法的实现细节,你应该在任何进一步的行动之前看一下GSL代码 - GSL是标准的数值库.

编辑:您可以通过在gcc/icc中包含积极的浮点优化标志来缩短执行时间.这会降低精度,但似乎这正是你想要的.

编辑2:您可以尝试制作粗网格并使用gsl例程(gsl_interp_cspline_periodic用于具有周期条件的样条曲线)来对该表进行样条化(与线性插值相比,样条线将减少误差=>您需要更少的点在您的表格上= >减少缓存未命中率)!

Answer 2

joh*_*yrd 29

这是C++中保证最快的正弦函数:

double FastSin(double x)
{
    return 0;
}

归档时间：	12 年，5 月前
查看次数：	62528 次
最近记录：	6 年，2 月前