如何在PyTorch中清除Cuda内存

Question

如何在PyTorch中清除Cuda内存

我正在尝试获取已经训练过的神经网络的输出。输入是大小为300x300的图像。我使用的批量大小为1，但是CUDA error: out of memory成功获取25张图像的输出后，仍然出现错误。

我在网上搜索了一些解决方案并遇到了torch.cuda.empty_cache()。但这似乎仍不能解决问题。

这是我正在使用的代码。

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

train_x = torch.tensor(train_x, dtype=torch.float32).view(-1, 1, 300, 300)
train_x = train_x.to(device)
dataloader = torch.utils.data.DataLoader(train_x, batch_size=1, shuffle=False)

right = []
for i, left in enumerate(dataloader):
    print(i)
    temp = model(left).view(-1, 1, 300, 300)
    right.append(temp.to('cpu'))
    del temp
    torch.cuda.empty_cache()

Run Code Online (Sandbox Code Playgroud)

这种for loop运行给内存错误之前为25次，每次时间。

每次，我都会在网络中发送一个新图像进行计算。因此，在循环中的每次迭代之后，我实际上都不需要将先前的计算结果存储在GPU中。有什么办法可以做到这一点？

任何帮助将不胜感激。谢谢。

Answer 1

Ale*_*lex 23

准确回答问题How toclear CUDA memory in PyTorch。在谷歌colab中，我尝试了torch.cuda.empty_cache()。但这对我没有帮助。使用这段代码确实帮助我刷新了 GPU：

import gc
torch.cuda.empty_cache()
gc.collect()

Run Code Online (Sandbox Code Playgroud)

这个问题可能会有所帮助。

Answer 2

ntd*_*ntd 8

我弄清楚哪里出了问题。我将解决方案发布为其他可能在同一问题上苦苦挣扎的人的答案。

基本上，PyTorch的作用是，每当我通过网络传递数据时，它都会创建一个计算图，并将计算结果存储在GPU内存中，以防我想在反向传播期间计算梯度。但是由于我只想执行前向传播，因此只需要torch.no_grad()为模型指定即可。

因此，我代码中的for循环可以重写为：

for i, left in enumerate(dataloader):
    print(i)
    with torch.no_grad():
        temp = model(left).view(-1, 1, 300, 300)
    right.append(temp.to('cpu'))
    del temp
    torch.cuda.empty_cache()

Run Code Online (Sandbox Code Playgroud)

no_grad()为我的模型指定告诉PyTorch我不想存储任何以前的计算，从而释放了我的GPU空间。

那很有意思。改变模型模式（从训练到评估）有帮助吗？我想知道是否有一个内部机制可以自动告诉 pytorch 模式已更改为 eval，因此无需保存计算？这意味着如果 net.eval() 没有明确告诉 pytorch 在前向传递期间不要保存计算，我可以使用“with torch.no_grad()”进行验证和推理？ (2认同)

归档时间：	6 年，6 月前
查看次数：	5137 次
最近记录：	6 年，6 月前