如何实现没有未定义行为的快速逆sqrt？

Question

如何实现没有未定义行为的快速逆sqrt？

Rus*_*lan 15 c++ strict-aliasing undefined-behavior

根据我对严格别名规则的理解,这个快速反平方根的代码将导致C++中未定义的行为:

float Q_rsqrt( float number )
{
    long i;
    float x2, y;
    const float threehalfs = 1.5F;

    x2 = number * 0.5F;
    y  = number;
    i  = * ( long * ) &y; // type punning
    i  = 0x5f3759df - ( i >> 1 );
    y  = * ( float * ) &i;
    y  = y * ( threehalfs - ( x2 * y * y ) );

    return y;
}

Run Code Online (Sandbox Code Playgroud)

这段代码确实会导致UB吗？如果是,如何以符合标准的方式重新实现？如果没有,为什么不呢？

假设:在调用此函数之前,我们已经以某种方式检查了浮点数是IEEE 754 32位格式,sizeof(long)==sizeof(float)并且平台是小端的.

Answer 1

Chr*_*ica 9

符合标准的方式是std::memcpy.在您指定的假设下,这应符合标准.如果可能的话,任何合理的编译器都会把它变成一堆寄存器移动.此外,我们还可以使用C++ 11 static_assert和固定宽度整数类型来缓解(或至少检查)您做出的一些假设<cstdint>.无论如何,Endianness是无关紧要的,因为我们不在这里处理任何数组,如果整数类型是little-endian,浮点类型也是.

float Q_rsqrt( float number )
{
    static_assert(std::numeric_limits<float>::is_iec559, 
                  "fast inverse square root requires IEEE-comliant 'float'");
    static_assert(sizeof(float)==sizeof(std::uint32_t), 
                  "fast inverse square root requires 'float' to be 32-bit");
    float x2 = number * 0.5F, y = number;
    std::uint32_t i;
    std::memcpy(&i, &y, sizeof(float));
    i  = 0x5f3759df - ( i >> 1 );
    std::memcpy(&y, &i, sizeof(float));
    return y * ( 1.5F - ( x2 * y * y ) );
}

Run Code Online (Sandbox Code Playgroud)

Answer 2

yur*_*hek 6

你应该用memcpy.AFAIK这是唯一符合标准的方式,编译器足够聪明,可以用单个单词移动指令替换调用.有关这些说法背后的推理,请参阅此问题.

归档时间：	11 年，6 月前
查看次数：	1496 次
最近记录：	11 年，6 月前