Pytorch 可以将张量移至 GPU,但 nvidia-smi 显示没有使用 GPU 内存

Jer*_* Lu 5 gpu nvidia tensorflow pytorch

你好~我对这种情况很困惑。

首先,我的 tf 和 pytorch 都可以检测到我的 GPU(使用 torch.cuda,is_available()),但是我的模型几天前在 GPU 上运行得很好,今天只能在 cpu 上运行。似乎 pytorch 和 tf 跳过直接将模型传递给 GPU。

其次,我在 python 交互模式下进行了测试:

import torch
x = torch.randn(10000,1000).cuda()
Run Code Online (Sandbox Code Playgroud)

这条线工作正常,当我输入时

x.device
Run Code Online (Sandbox Code Playgroud)

python 向我显示 x 位于 GPU 设备索引 0 上,但同时。nvidia-smi 中没有使用 GPU 内存

第三,当我监控我的 GPU 状态时

watch -n 1 nvidia-smi
Run Code Online (Sandbox Code Playgroud)

我发现我的 GPU 的温度或功率在很长一段时间内没有变化。

任何帮助将不胜感激!!