加载VGG16时资源耗尽OOM

Sha*_*sai 9 gpu neural-network keras tensorflow

如果这个问题看起来很基本,我会事先道歉,但我是Tensorflow的新手并感谢任何帮助.

我发现我必须经常重新启动计算机才能从keras.applications加载VGG16等模型.我有一台相当高端的机器,配备4个GeForce GTX 1080 Ti GPU和Intel®Core™i7-6850K CPU @ 3.60GHz×12,用于我的CPU,仅用于Tensorflow(通过Keras).

一旦我重新启动,我将能够成功加载模型(例如VGG16)并训练大型训练数据集.但是,如果我让我的计算机闲置一段时间并重新运行相同的程序,我将获得资源耗尽消息(OOM),可以通过重新启动我的计算机来修复.每隔几个小时不停地重新启动计算机是非常令人沮丧的.有谁知道发生了什么以及如何解决这个问题?

Mat*_*ský 1

如果批处理大小 > 1,请尝试使用较低的批处理大小,这可能会降低 GPU 的内存要求。

另外,如果您结束使用网络,请通过 检查 GPU 内存nvidia-smi是否已释放。如果没有,请终止加载网络的进程(通常是一些 python 解释器)。