我在图像处理中有一个应用程序的几个文件.由于在执行某些图像处理算法时图像的行数和列数没有变化,我试图将这些值放在常量内存中.我的应用看起来像:
Imageproc.cuh
...
...
__constant__ int c_rows;
__constant__ int c_cols;
#ifdef __cplusplus
extern "C"
{
#endif
...
...
#ifdef __cplusplus
}
#endif
Run Code Online (Sandbox Code Playgroud)
Imageproc.cu
...
...
int algorithm(float *a, const int rows, const int cols){
...
...
checkCudaError(cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int)));
checkCudaError(cudaMemcpyToSymbol(&c_cols, &cols, sizeof(int)));
dim3 block(T, T);
dim3 grid(cols/T+1, rows/T+1);
kernel<<<grid, block>>>( ... );
...
...
}
Run Code Online (Sandbox Code Playgroud)
它编译得很好但是在尝试运行程序时我得到了 invalid device symbol cudaMemcpyToSymbol(&c_rows, &rows, sizeof(int))
我不能把这些变量放在常量内存中或者我缺少什么?
如果您的符号声明如下:
__constant__ int c_rows;
Run Code Online (Sandbox Code Playgroud)
然后正确的电话cudaMemcpyToSymbol
就是
int rows = 5;
cudaMemcpyToSymbol(c_rows, &rows, sizeof(int)));
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
5581 次 |
最近记录: |