Ste*_*non 10
GPU刚刚开始支持硬件的双精度,但在不久的将来它将继续比单精度慢得多.多年来已经开发出各种各样的技术来使用由具有快速硬件支持的任何精度的多个浮点组成的表示来合成更高精度的浮点,但是开销非常大.IIRC,crlibm手册对其中一些技术进行了很好的讨论,包括错误分析和伪代码(CRLIBM使用它们将数字表示为多个双精度值,但相同的技术可以与单个一起使用)
如果不了解您正在尝试做什么,就很难给出更好的答案.对于某些算法,只有一小部分计算需要高精度; 如果你遇到这样的情况,你可能会在GPU上获得不错的性能,尽管代码不一定非常漂亮或易于使用.如果您在整个算法中普遍需要高精度,那么GPU目前可能不适合您.
最后,为什么HLSL而不是像CUDA或OpenCL这样的面向计算的语言?