错误:分配具有形状的张量时出现 OOM

Moh*_*oud 16 gpu python-3.x gunicorn tensorflow

在使用 Apache JMeter 进行性能测试期间,我的初始模型遇到了问题。

错误:分配形状为 [800,1280,3] 的张量并在 /job:localhost/replica:0/task:0/device:GPU:0 上通过分配器 GPU_0_bfc [[Node: Cast = CastDstT=DT_FLOAT, SrcT=DT_UINT8, _device="/job:localhost/replica:0/task:0/device:GPU:0"]] 提示:如果您想在 OOM 发生时查看已分配张量的列表,请将 report_tensor_allocations_upon_oom 添加到 RunOptions for current分配信息。

Cor*_*zin 18

OOM 代表内存不足。这意味着您的 GPU 空间不足,大概是因为您分配了其他太大的张量。您可以通过缩小模型或减少批量大小来解决此问题。从它的外观来看,您正在输入一张大图像 (800x1280),您可能需要考虑下采样。

  • 我在第四次训练时收到此错误。1-3 纪元成功了。你知道为什么会出现这种情况吗?第 4 个时期对 GPU 的内存需求与前 3 个时期的内存需求相同。我是否应该在处理每个批次后释放 GPU 内存或类似的事情? (5认同)