小编Rob*_*lla的帖子

Ubuntu          22.04
python          3.10.8
tensorflow      2.11.0
cudatoolkit     11.2.2
cudnn           8.1.0.77
nvidia-tensorrt 8.4.3.1
nvidia-pyindex  1.0.9

Run Code Online (Sandbox Code Playgroud)

home/dan/anaconda3/envs/tf/lib/python3.10/site-packages/tensorrt在我的目录中创建了一个 conda 环境“tf”

libnvinfer_builder_resource.so.8.4.3
libnvinfer_plugin.so.8
libnvinfer.so.8
libnvonnxparser.so.8
libnvparsers.so.8
tensorrt.so

Run Code Online (Sandbox Code Playgroud)

跑步时python3 -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"我得到

tensorflow/compiler/xla/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libnvinfer.so.7';
dlerror: libnvinfer.so.7: cannot open shared object file: No such file or directory;
LD_LIBRARY_PATH: :/home/dan/anaconda3/envs/tf/lib

tensorflow/compiler/xla/stream_executor/platform/default/dso_loader.cc:64] Could not load dynamic library 'libnvinfer_plugin.so.7';
dlerror: libnvinfer_plugin.so.7: cannot open shared object file: No such file or directory;
LD_LIBRARY_PATH: :/home/dan/anaconda3/envs/tf/lib

tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Cannot …

Run Code Online (Sandbox Code Playgroud)

nvidia tensorflow cudnn tensorrt

Dan*_*ege

2022 12-30

27
推荐指数

3
解决办法

5万
查看次数

为CUDA内核调用设置VS 2010 Intellisense

我刚刚开始进行CUDA编程,而且它的功能非常好,我的GPU已经被认可了.我在这里使用这个非常有用的指南在Visual Studio中部分设置了Intellisense: http://www.ademiller.com/blogs/tech/2010/10/visual-studio-2010-adding-intellisense-support-for-cuda-c/

和这里: http://www.ademiller.com/blogs/tech/2011/05/visual-studio-2010-and-cuda-easier-with-rc2/

但是,Intellisense仍然没有像这样接受内核调用:

// KernelCall.cu
#include <iostream>
#include "cuda.h"
#include "cuda_runtime.h"
#include "device_launch_parameters.h"

__global__ void kernel(void){}

int main()
{
    kernel<<<1,1>>>();

    system("pause");
    return 0;
}

Run Code Online (Sandbox Code Playgroud)

行内核<<< 1,1 >>>()用红色下划线,特别是第一个左边的一个箭头,错误读数为"Error:expected and expression".但是,如果我将鼠标悬停在该函数上,则会正确显示其返回类型和参数.它仍然编译得很好,我只是想知道如何摆脱这个小烦恼.

intellisense cuda visual-studio-2010 gpu-programming

sj7*_*755

2019 08-10

19
推荐指数

3
解决办法

2万
查看次数

cuda.amp 和 model.half() 有什么区别？

根据https://pytorch.org/blog/acceleating-training-on-nvidia-gpus-with-pytorch-automatic-mixed- precision/

我们可以用：

   with torch.cuda.amp.autocast():
      loss = model(data)

Run Code Online (Sandbox Code Playgroud)

为了将操作转换为混合精度。

另一件事是我们可以用来 model.half()将所有模型权重转换为半精度。

这两个命令有什么区别？
如果我想利用FP16（为了创建更大的模型和更短的训练时间），我需要什么？我需要使用 model.half()还是正在使用torch.cuda.amp（根据上面的链接）？

nvidia pytorch

use*_*129

2021 11-17

15
推荐指数

1
解决办法

8828
查看次数

哪个 PyTorch 版本与 CUDA 计算能力 3.0 兼容？

我有一个 Nvidia GeForce GTX 770，它是 CUDA 计算能力 3.0，但是在 GPU 上运行 PyTorch 训练时，我收到警告

Found GPU0 GeForce GTX 770 which is of cuda capability 3.0.
PyTorch no longer supports this GPU because it is too old.
The minimum cuda capability that we support is 3.5.

Run Code Online (Sandbox Code Playgroud)

以及随后的错误RuntimeError: CUDA error: no kernel image is available for execution on the device。

是否有旧的 PyTorch 版本支持像我这样具有 CUDA 功能 3.0 的显卡？如果是，哪个版本以及在哪里可以找到此信息？是否有一个表格可以在其中找到支持的 CUDA 版本和兼容性版本？

如果相关的话，我已经安装了 CUDA 10.1。

gpu pytorch

Ale*_*cha

2023 04-11

14
推荐指数

1
解决办法

5249
查看次数