无法加载动态库“libcupti.so.11.0”;dlerror: libcupti.so.11.0: 无法打开共享对象文件

Tew*_*nea 5 python virtualenv tensorflow ubuntu-18.04

系统信息

  • 操作系统平台和发行版(例如Linux Ubuntu 18.04)
  • 乌班图20.04
  • Python版本:3.6
  • 使用 virtualenv 安装
  • CUDA/cuDNN 版本:11.5 / 8.1.0.77
  • GPU型号和内存:RTX 3090 24GB nvidia驱动程序460.39
  • TensorFlow版本:2.4.0 pip install tensorflow-gpu==2.4.0

描述问题

安装了 cuda 11.2 和 cudnn 8.1.0.77。运行train.py时遇到以下问题

无法加载动态库“libcupti.so.11.0”;dlerror: libcupti.so.11.0: 无法打开共享对象文件

Tew*_*nea 2

解决了问题

  • 列出 lib 文件/usr/local/cuda-11.2/extras/CUPTI/lib64/lib*

    $ ls /usr/local/cuda-11.2/extras/CUPTI/lib64/lib*
    
    Run Code Online (Sandbox Code Playgroud)
  • 我找不到libcupti.so.11.0。其他文件应该在那里,例如libcupti.so,,libcupti.so.11.2...

  • libcupti.so.11.2使用命令“sudo ln -s”管理 libcupti.so.11.0 之间的链接

    $ sudo ln -s /usr/local/cuda-11.2/extras/CUPTI/lib64/libcupti.so.11.2 /usr/local/cuda-11.2/extras/CUPTI/lib64/libcupti.so.11.0
    
    Run Code Online (Sandbox Code Playgroud)
  • 列出 /usr/lib/x86_64-linux-gnu/libcup* 上的 lib 文件

    ls /usr/lib/x86_64-linux-gnu/libcup*
    
    Run Code Online (Sandbox Code Playgroud)
  • 我找不到libcupti.so.11.0。其他文件应该存在,例如libcupti.so,,,,...libcupti.so,2libcupti.so.10.1

  • 管理命令之间的链接libcupti.so.11.2libcupti.so.11.0使用命令sudo ln -s

    $ sudo ln -s /usr/local/cuda-11.2/extras/CUPTI/lib64/libcupti.so.11.2 /usr/lib/x86_64-linux-gnu/libcupti.so.11.0
    
    Run Code Online (Sandbox Code Playgroud)

这解决了我的问题