我们有以下串行C代码在运行
两个向量a []和b []:
double a[20000],b[20000],r=0.9; for(int i=1;i<=10000;++i) { a[i]=r*a[i]+(1-r)*b[i]]; errors=max(errors,fabs(a[i]-b[i]); b[i]=a[i]; }
请告诉我们如何将此代码移植到CUDA和Cublas?
c++ cuda thrust
c++ ×1
cuda ×1
thrust ×1