CUDA 链接错误:未解析的外部但外部在 *.cu 文件中指定

JPM*_*JPM 4 cuda gpu

使用 Cuda 5.0,VS2010

该项目在 VS2012 中编译和链接正常,但 VS2012 不支持 Nsight 调试,所以我也在 VS2010 中开发。所以我有一个 VS2010 项目文件,但我使用的是相同的源代码文件(.h、.cpp、.cu、.cuh。

VS2010 build 编译一切正常,但链接报告错误与未解析的外部:

 Generating Code...
1>videoFuncUnThread.obj : error LNK2019: unresolved external symbol _runKernel referenced in function "void __cdecl videoFuncUnThread(int,bool,unsigned int * const)" (?videoFuncUnThread@@YAXH_NQAI@Z)
1>D:\StrApp\Viper1B_10\Viper1B_10\Debug\Viper1B_10.exe : fatal error LNK1120: 1 unresolved externals
1>
1>Build FAILED.
1>
Run Code Online (Sandbox Code Playgroud)

缺少的符号 runKernel 是调用设备端模块(驻留在 PTX 文件中)的主机端模块。

当我搜索 runKernel 的所有出现时,我得到 3 行:

filter.cu(127):                     extern "C" CUresult runKernel (int numFrames,     cudaStream_t stream, bool firstBatch, int* searchLimit) { ... } // module code 
videofuncunthread.cpp(28): extern "C" CUresult runKernel(int numFrames, cudaStream_t stream,  bool firstBatch,  int* search);  // 
videofuncunthread.cpp(137): CUresult resultKernel = runKernel( NinBatch, gStream, firstBatch, (int *)searchLimit);
Run Code Online (Sandbox Code Playgroud)

由于“filter.cu”编译,这意味着调用行(137)与原型声明(28)一致;也可以看到 filter.cu 中的定义与原型相同。

最后,我注意到我已经在 VS2010 上成功地编译、链接和运行了 cuda 5.0 示例中的示例。我已经验证我在两个项目中使用相同的 Cuda 构建规则,并且我的项目和 Cuda 示例项目之间的项目属性相同。

您可以提供的任何见解或建议将不胜感激。

谢谢

Tom*_*Tom 5

您确定 VS2010 正在构建和链接您的 CUDA 代码吗?有关设置 VS2010,特别是启用 CUDA 构建自定义的说明,请参阅此答案。另请注意,如果您.cu在构建自定义之前添加了文件,则需要将.cu文件类型设置为CUDA C/C++(右键单击文件Properties,设置Item Type)。

一种快速检查是在.cu文件中进行更改并确保它正在重新编译。