浮点定向舍入和优化

Kon*_*pov 0 c++ floating-point rounding ieee-754

有以下代码在不同的舍入模式下计算相同的表达式:

#include <iostream>
#include <fenv.h>
#pragma STDC FENV_ACCESS ON
#define SIZE 8

double foo(double * a, double * b){
    double sum = 0.0;
    for(unsigned int i = 0; i < SIZE; i++) {
        sum+= b[i] / a[i];
    }
    return sum;
}

int main() {
    double a[]={127, 131, 137, 139, 149, 151, 157, 163};
    double b[SIZE];

    for(unsigned int i = 0; i < SIZE; i++){
        b[i] = i+1;
    }

    printf("to nearest:   %.18f \n", foo(a, b));

    fesetround(FE_TOWARDZERO);
    printf("toward zero:  %.18f \n", foo(a, b));

    fesetround(FE_UPWARD);
    printf("to +infinity: %.18f \n", foo(a, b));

    fesetround(FE_DOWNWARD);
    printf("to -infinity: %.18f \n", foo(a, b));

    return 0;
}
Run Code Online (Sandbox Code Playgroud)

用带有-O0选项的g++编译时,输出如下:

to nearest:   0.240773868136782450
toward zero:  0.240773868136782420
to +infinity: 0.240773868136782560
to -infinity: 0.240773868136782420
Run Code Online (Sandbox Code Playgroud)

但是当使用-O3选项编译它时,我们有:

to nearest:   0.240773868136782480
toward zero:  0.240773868136782480
to +infinity: 0.240773868136782480
to -infinity: 0.240773868136782480
Run Code Online (Sandbox Code Playgroud)

编译器: g++ (MinGW.org GCC-6.3.0-1) 6.3.0

为什么舍入模式不改变?如何解决?

(如果fesetround在循环的每次迭代中调用for(在foo函数内部),那么结果对于任何编译标志都是正确的。)

UPD:我认为问题在于编译器计算fesetroundat 编译类型的值,正如@haneefmubarak 在/sf/answers/1842389321/ 中指出的那样。问题是如何预防。(仅适用于一个命令,fesetround不适用于整个功能)。

我编写了用于舍入例程的包装器,__attribute__ ((noinline))并在main函数中调用它们:

void __attribute__ ((noinline)) rounddown(){
    fesetround(FE_DOWNWARD);
}

void __attribute__ ((noinline)) roundup(){
    fesetround(FE_UPWARD);
}

int main() {
    ...

    roundup();
    printf("to +infinity: %.18f \n", foo(a, b));

    rounddown();
    printf("to -infinity: %.18f \n", foo(a, b));
    ...
}
Run Code Online (Sandbox Code Playgroud)

但它不起作用。有任何想法吗?

UPD2:一个更清楚的例子:

正确的舍入 (-O0)

舍入失败 (-03)

很容易看出确切的结果:

2/3 + 2/5 + 4/7 + 4/11 = 2.0017316017316017316...
Run Code Online (Sandbox Code Playgroud)

Eri*_*hil 5

根据问题作者的评论,他们使用的编译器不支持#pragma STDC FENV_ACCESS ON并打印警告说。

代码可能在未优化的版本中“工作”,因为fesetround它确实改变了硬件中的舍入模式,并且编译器发出直接的代码,以源代码表示的名义顺序执行操作。

优化代码不起作用的原因可能包括:

  • 编译器在编译时执行一些算术运算,忽略fesetround调用。
  • 在优化期间,编译器重新排序操作,可能fesetround以与源代码所示不同的顺序执行算术运算和调用。该fesetround电话甚至可以完全去除。

在 C 中可能没有修复此问题。如果编译器不支持访问浮点环境,则可能无法强制它生成必要的代码。声明某些对象volatile可能会强制某些操作在执行时以所需的顺序执行,但编译器可能仍会fesetround根据这些操作重新排序,具体取决于fesetround内置于其中的信息。

可能需要使用汇编语言以所需的舍入模式执行浮点运算。