CUDA SDK示例在multi-gpu系统中抛出各种错误

pdr*_*aus 7 cuda multi-gpu ubuntu-12.04

我有一个运行Ubuntu Precise的Dell Precision Rack,配备两个Tesla C2075和一个显示设备Quadro 600.我最近在我的桌面计算机上完成了一些测试,现在尝试将东西移植到工作站.

由于CUDA不存在,我根据本指南安装了它,并根据这个建议调整了SDK Makefile .

我现在面临的是,没有一个样本(我测试了10个不同的样本)正在运行.这些是我得到的错误:


[deviceQuery] starting...

./deviceQuery Starting...

 CUDA Device Query (Runtime API) version (CUDART static linking)

cudaGetDeviceCount returned 10
-> invalid device ordinal
[deviceQuery] test results...
FAILED

> exiting in 3 seconds: 3...2...1...done!
Run Code Online (Sandbox Code Playgroud)
[MonteCarloMultiGPU] starting...

CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU
==================
Parallelization method  = threaded
Problem scaling         = weak
Number of GPUs          = 0
Total number of options = 0
Number of paths         = 262144
main(): generating input data...
main(): starting 0 host threads...
Floating point exception (core dumped)
Run Code Online (Sandbox Code Playgroud)
[reduction] starting...

reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal.
Run Code Online (Sandbox Code Playgroud)
[simplePrintf] starting...

simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal.
Run Code Online (Sandbox Code Playgroud)

正如您所看到的,大多数错误指向cudaGetDeviceCount调用的问题,该调用返回错误代码10.根据手册,问题是:

cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device.
Run Code Online (Sandbox Code Playgroud)

不幸的是,我能找到的唯一解决方案建议检查设备电源插头.我做到了,并没有错.重新启动工作站也无济于事.

我很乐意提供有关配置的更多详细信息.只需发表评论!

pdr*_*aus 2

由于对我原来问题的评论,我找到了解决方案。我按照 本指南学习如何正确设置rc.local(不要忘记chmod您的脚本)。