加载共享库时出错:libcudart.so.4:无法打开共享对象文件:没有这样的文件或目录

Cod*_*der 3 c linux redhat cuda

我正在尝试在群集上执行MPI和CUDA代码.代码在单机上工作正常,但是当我尝试在集群上执行它时,我得到错误:

加载共享库时出错:libcudart.so.4:无法打开共享对象文件:没有这样的文件或目录

我检查了我的PATH和LD_PATH,看起来没问题.我有一个.bashrc文件,其中包含以下条目 -

export PATH = $ PATH:/ usr/local/lib /:/ usr/local/lib/openmpi:/ usr/local/cuda/bin export LD_LIBRARY_PATH = $ LD_LIBRARY_PATH:/ usr/local/lib:/ usr/local/lib /的openmpi /:在/ usr /本地/ CUDA/lib目录

所有机器都具有相同的CUDA和OpenMPI安装.

我在/etc/ld.so.conf中也有/ usr/local/cuda/lib

谁能帮我这个.这个问题真的很烦人.

谢谢.

Dmi*_*rov 5

如果要在群集上发送批处理作业,请添加如下命令

echo $LD_LIBRARY_PATH 
ldd ./your_app 
Run Code Online (Sandbox Code Playgroud)

到您的批处理脚本.这应该有助于调试问题.

还要确保在mpirun中导出环境变量.例如,在OpenMPI中,您将运行您的代码

mpirun -x LD_LIBRARY_PATH ...
Run Code Online (Sandbox Code Playgroud)