如何查看NCCL的版本

Ahm*_*mad 11 python nvidia tensorflow horovod

我远程访问高性能计算节点。我不确定 NVIDIA Collective Communications Library (NCCL) 是否安装在我的目录中。有没有办法检查NCCL是否安装?

小智 19

你可以试试

locate nccl| grep "libnccl.so" | tail -n1 | sed -r 's/^.*\.so\.//'
Run Code Online (Sandbox Code Playgroud)

或者如果您使用 PyTorch:

python -c "import torch;print(torch.cuda.nccl.version())"
Run Code Online (Sandbox Code Playgroud)

检查此链接Command Cheatsheet: Checking Versions of Installed Software / Libraries / Tools for Deep Learning on Ubuntu

对于容器,locate有时没有可用的容器,可以将其替换为ldconfig -v

ldconfig -v | grep "libnccl.so" | tail -n1 | sed -r 's/^.*\.so\.//'
Run Code Online (Sandbox Code Playgroud)

  • 当我输入“locate nccl|”时 grep“libnccl.so”| 尾-n1 | sed -r 's/^.*\.so\.//'1,它什么也没显示。 (2认同)