Tensorflow CPU RAM分配

Ken*_*eth 6 python python-3.x tensorflow

我在Tensorflow中遇到了令人难以置信的大量(CPU)RAM使用率,而大约每个变量都在GPU设备上分配,并且所有计算都在那里运行.即便如此,RAM使用率至少超过VRAM使用2倍.我试图理解为什么要看它是否可以得到补救或是否是不可避免的.

题

所以我的主要问题是:Tensorflow是否在(CPU)RAM上分配并维护所有GPU变量的副本？如果是,那么(在哪个阶段,见下文)分配什么？为什么在CPU内存中分配它有用呢？

更多信息

我有3个阶段,其中我看到RAM急剧增加.

首先,在定义图形时(我附加了具有相当大的损失函数的VGG-19,它迭代了许多翻译的激活图).这为RAM使用增加了2 GB.
其次,定义优化器(我使用Adam)增加了250MB.
初始化全局变量增加了750MB.

然后它保持稳定并且运行速度非常快(全部在GPU上).(这里提到的数据量是当我输入大小为8x8x3,批量大小为1的小图像时.如果我执行的操作超过1x16x16x3,则进程会因为溢出我的8GB RAM + 6GB交换限制而被杀死).

请注意,我使用tf.RunMetadata和tensorboard上的可视化记录了tf.ConfigProto(log_device_placement = True)的变量位置和GPU使用情况.

感谢您的任何帮助.

系统信息

我是否编写了自定义代码(而不是使用TensorFlow中提供的库存示例脚本):是的
操作系统平台和发行版:Linux Ubuntu 17.10
从(源或二进制)安装的TensorFlow:二进制
TensorFlow版本(使用下面的命令):1.7
Python版本:3.6.3
GCC /编译器版本(如果从源代码编译):6.4.0
CUDA/cuDNN版本:9.0
GPU模型和内存:NVidia GeForce Titan Xp

归档时间：	7 年，10 月前
查看次数：	3062 次
最近记录：	7 年，10 月前

Python中"(1,)== 1"的含义是什么？ 118

conda或conda-forge应该用于Python环境吗？ 97

Python是否具有toString()等价物,我可以将db.Model元素转换为String吗？ 45

如何在Tensorflow中关闭丢失测试？ 26

Uvicorn的目的是什么？ 16

Python 3 Tkinter无边框全屏应用程序 14

在 python 字典中为 mypy 指定键 7

为什么 BERT 中的矩阵称为 Query、Key 和 Value？ 5

TensorFlow/Keras 的 fit() 函数的 class_weight 参数如何工作？ 4

为什么使用 tensorflow2.0 的同一数据集的训练准确度和验证准确度不同？ 3

如何重命名本地Git分支？ 8033

有没有办法在Android上运行Python？ 2097

命令折叠代码的所有部分？ 1576

LINQ中的多个"order by" 1537

如何获取Android应用程序的构建版本号？ 1198

创建一个带参数的Bash别名？ 1164

在React JSX中循环 1131

我怎么知道分支是否已经合并为主分支？ 1077

如何在Vim中有效地处理多个文件？ 1074

在Notepad ++中将制表符转换为空格 1042