小编Thi*_*hru的帖子

出现错误“资源耗尽:在使用形状 [1800,1024,28,28] 分配张量并在 /job:localhost/... 上键入 float 时出现 OOM”

在开始训练我的对象检测 Tensorflow 2.5 GPU 模型时,我收到资源耗尽错误。我使用 18 个训练图像和 3 个测试图像。我使用的预训练模型是 Tensorflow Zoo 2.2 中的 Faster R-CNN ResNet101 V1 640x640 模型。我使用具有 8 GB 专用内存的 Nvidia RTX 2070 来训练我的模型。

我感到困惑的是,当训练集如此之小时,为什么训练过程会占用 GPU 如此多的内存。这是我遇到的错误的 GPU 内存摘要:

Limit:                      6269894656
InUse:                      6103403264
MaxInUse:                   6154866944
NumAllocs:                        4276
MaxAllocSize:               5786902272
Reserved:                            0
PeakReserved:                        0
LargestFreeBlock:                    0
Run Code Online (Sandbox Code Playgroud)

我还将训练数据的批量大小减少到 6,将测试数据的批量大小减少到 1。

out-of-memory object-detection tensorflow object-detection-api tensorflow2.0

3
推荐指数
1
解决办法
8234
查看次数