小编Kon*_*pov的帖子

 long a* = new long[32];
 long b* = new long[32];
 double c* = new double[32];
 double d = 3.14159268;
  //set a, b and c arrays
  //.....
  for(int i = 0; i < 32; i ++){
    d+= (a[i] % b[i])/c[i];
  }

Run Code Online (Sandbox Code Playgroud)

我如何使用英特尔 C++ 矢量化功能（例如#pragma simd 或 sse- 指令）来实现此周期？

如果我写：

  #pragma simd reduction(+:c)
  for(int i = 0; i < 32; i ++){
    d+= (a[i] % b[i])/c[i];
  }

Run Code Online (Sandbox Code Playgroud)

那么速度不会增加:(

c intel vectorization

Kon*_*pov

2013 09-24

1
推荐指数

1
解决办法

2699
查看次数

浮点定向舍入和优化

有以下代码在不同的舍入模式下计算相同的表达式：

#include <iostream>
#include <fenv.h>
#pragma STDC FENV_ACCESS ON
#define SIZE 8

double foo(double * a, double * b){
    double sum = 0.0;
    for(unsigned int i = 0; i < SIZE; i++) {
        sum+= b[i] / a[i];
    }
    return sum;
}

int main() {
    double a[]={127, 131, 137, 139, 149, 151, 157, 163};
    double b[SIZE];

    for(unsigned int i = 0; i < SIZE; i++){
        b[i] = i+1;
    }

    printf("to nearest:   %.18f \n", foo(a, b));

    fesetround(FE_TOWARDZERO);
    printf("toward zero:  %.18f \n", foo(a, …

Run Code Online (Sandbox Code Playgroud)

c++ floating-point rounding ieee-754

Kon*_*pov

2018 10-24

0
推荐指数

1
解决办法

202
查看次数