如何防止张量流分配GPU内存的全部？

Fab*_* C. 252 python tensorflow nvidia-titan

我在一个共享计算资源的环境中工作,也就是说,我们有一些服务器机器配备了几个Nvidia Titan X GPU.

对于小到中等大小的型号,12GB的Titan X通常足以让2-3人在同一GPU上同时进行训练.如果模型足够小以至于单个模型没有充分利用Titan X的所有计算单元,那么与在另一个训练过程之后运行一个训练过程相比,这实际上可以导致加速.即使在并发访问GPU确实减慢了单个培训时间的情况下,仍然可以灵活地让多个用户同时在GPU上运行.

TensorFlow的问题在于,默认情况下,它在启动时会在GPU上分配全部可用内存.即使对于一个小的2层神经网络,我也看到12 GB的Titan X已用完.

有没有办法让TensorFlow只分配4GB的GPU内存,如果有人知道这个数量对于给定的模型来说足够了？

您可以tf.Session通过传递a tf.GPUOptions作为可选config参数的一部分来设置构造a时要分配的GPU内存的分数:

# Assume that you have 12GB of GPU memory and want to allocate ~4GB:
gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)

sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

Run Code Online (Sandbox Code Playgroud)

在per_process_gpu_memory_fraction作为上,将用于通过所述方法在每个GPU在同一机器上的GPU存储器的量的硬上限.目前,该分数统一应用于同一台机器上的所有GPU; 没有办法在每GPU的基础上设置它.

相关说明:设置CUDA_VISIBLE_DEVICES以将TensorFlow限制为单个GPU对我有用.请参阅http://www.acceleware.com/blog/cudavisibledevices-masking-gpus (15认同)
非常感谢你。该信息在当前文档中相当隐蔽。我永远不会自己找到它：-)如果您可以回答，我想问两个附加信息：1-这是否限制了曾经使用的内存量，或者仅仅是限制了最初分配的内存？（即，如果计算图需要它，它将仍然分配更多的内存）2-是否可以在每个GPU的基础上进行设置？ (3认同)
似乎内存分配超出了请求，例如我在24443MiB gpu上请求了per_process_gpu_memory_fraction = 0.0909并获得了占用2627MiB的进程 (2认同)
我似乎无法在"MonitoredTrainingSession"中使用它 (2认同)
@jeremy_rutman我相信这是由于cudnn和cublas上下文初始化引起的。这仅在您正在执行使用这些库的内核时才有意义。 (2认同)

config = tf.ConfigProto()
config.gpu_options.allow_growth=True
sess = tf.Session(config=config)

Run Code Online (Sandbox Code Playgroud)

https://github.com/tensorflow/tensorflow/issues/1578

这个正是我想要的,因为在多用户环境中,指定要在代码本身中保留的GPU内存的确切数量是非常不方便的. (12认同)
另外，如果您将Keras与TF后端一起使用，则可以使用它并从keras import backend运行为K和K.set_session（sess）以避免内存限制 (2认同)

这是本书的摘录 Deep Learning with TensorFlow

在某些情况下,希望该过程仅分配可用内存的子集,或者仅增加该过程所需的内存使用量.TensorFlow 在会话中提供了两个配置选项来控制它.第一个是allow_growth选项,它尝试仅基于运行时分配分配尽可能多的GPU内存,它开始分配非常少的内存,并且当会话运行并且需要更多GPU内存时,我们扩展了TensorFlow所需的GPU内存区域处理.

1)允许增长:(更灵活)

config = tf.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.Session(config=config, ...)

Run Code Online (Sandbox Code Playgroud)

第二种方法是per_process_gpu_memory_fraction选项,它确定each应该分配可见GPU 的总内存量的分数.注意:不需要释放内存,它甚至可以在完成后恶化内存碎片.

2)分配固定内存:

仅通过以下方式分配40%每个GPU的总内存:

config = tf.ConfigProto()
config.gpu_options.per_process_gpu_memory_fraction = 0.4
session = tf.Session(config=config, ...)

Run Code Online (Sandbox Code Playgroud)

注意: 仅当您真正想要绑定TensorFlow进程上可用的GPU内存量时,这才有用.

对于 Tensorflow 2.0 和 2.1 版，请使用以下代码段：

 import tensorflow as tf
 gpu_devices = tf.config.experimental.list_physical_devices('GPU')
 tf.config.experimental.set_memory_growth(gpu_devices[0], True)

Run Code Online (Sandbox Code Playgroud)

对于以前的版本，以下代码段曾经对我有用：

import tensorflow as tf
tf_config=tf.ConfigProto()
tf_config.gpu_options.allow_growth=True
sess = tf.Session(config=tf_config)

Run Code Online (Sandbox Code Playgroud)

已针对TensorFlow 2.0 Alpha及更高版本进行了更新

从2.0 Alpha文档来看，答案现在只有一行，然后您可以使用TensorFlow进行任何操作：

import tensorflow as tf
tf.config.gpu.set_per_process_memory_growth(True)

Run Code Online (Sandbox Code Playgroud)

不超过。对于 TF 2.2，它是“tf.config.experimental.set_memory_growth” (3认同)
由于这是一个高度赞成的答案，我已经更新到了 TF 的最新版本。 (3认同)
@AkshayLAradhya 不，这仅适用于 TF 2.0 及更高版本。这里的其他答案适用于 1.13 及更早版本。 (2认同)

上面的所有答案都假定使用sess.run()调用执行,这将成为例外,而不是最近版本的TensorFlow中的规则.

当使用tf.Estimator框架(TensorFlow 1.4及更高版本)时,将分数传递给隐式创建的方法MonitoredTrainingSession是,

opts = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)
conf = tf.ConfigProto(gpu_options=opts)
trainingConfig = tf.estimator.RunConfig(session_config=conf, ...)
tf.estimator.Estimator(model_fn=..., 
                       config=trainingConfig)

Run Code Online (Sandbox Code Playgroud)

同样在Eager模式(TensorFlow 1.5及以上版本)中,

opts = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)
conf = tf.ConfigProto(gpu_options=opts)
tfe.enable_eager_execution(config=conf)

Run Code Online (Sandbox Code Playgroud)

编辑:11-04-2018 作为一个例子,如果你要使用tf.contrib.gan.train,那么你可以使用类似于下面的东西:

tf.contrib.gan.gan_train(........, config=conf)

Run Code Online (Sandbox Code Playgroud)

您可以使用

TF_FORCE_GPU_ALLOW_GROWTH=true

Run Code Online (Sandbox Code Playgroud)

在您的环境变量中。

在张量流代码中：

bool GPUBFCAllocator::GetAllowGrowthValue(const GPUOptions& gpu_options) {
  const char* force_allow_growth_string =
      std::getenv("TF_FORCE_GPU_ALLOW_GROWTH");
  if (force_allow_growth_string == nullptr) {
    return gpu_options.allow_growth();
}

Run Code Online (Sandbox Code Playgroud)

无耻的插件：如果你安装了 GPU 支持的 Tensorflow，无论你将其设置为仅使用 CPU 还是 GPU，会话都会首先分配所有 GPU。我可能会添加我的提示，即使您将图形设置为仅使用 CPU，您也应该设置相同的配置（如上回答:)）以防止不必要的 GPU 占用。

而在像 IPython 和 Jupyter 这样的交互界面中，你也应该设置配置，否则，它会分配所有内存，几乎没有给其他人留下。这有时很难注意到。

Tensorflow 2.0 Beta和（可能）超越

API再次更改。现在可以在以下位置找到它：

tf.config.experimental.set_memory_growth(
    device,
    enable
)

Run Code Online (Sandbox Code Playgroud)

别名：

tf.compat.v1.config.experimental.set_memory_growth
tf.compat.v2.config.experimental.set_memory_growth

参考文献：

另请参阅： Tensorflow-使用GPU：https : //www.tensorflow.org/guide/gpu

对于Tensorflow 2.0 Alpha，请参阅： 此答案

如果您使用的是 Tensorflow 2，请尝试以下操作：

config = tf.compat.v1.ConfigProto()
config.gpu_options.allow_growth = True
session = tf.compat.v1.Session(config=config)

Run Code Online (Sandbox Code Playgroud)

上面的所有答案都是指在TensorFlow 1.X版本中将内存设置到一定程度，或者允许TensorFlow 2.X.

该方法 tf.config.experimental.set_memory_growth确实适用于在分配/预处理期间允许动态增长。然而，人们可能希望从一开始就分配一个特定的 GPU 内存。

分配特定 GPU 内存背后的逻辑也是为了防止训练期间出现 OOM 内存。例如，如果在打开消耗视频内存的 Chrome 选项卡/任何其他视频消耗过程时进行训练，tf.config.experimental.set_memory_growth(gpu, True)可能会导致抛出 OOM 错误，因此在某些情况下需要从一开始就分配更多内存。

在 TensorFlow 2.X 中为每个 GPU 分配内存的推荐且正确的方式是通过以下方式完成的：

gpus = tf.config.experimental.list_physical_devices('GPU')
if gpus:
  # Restrict TensorFlow to only allocate 1GB of memory on the first GPU
  try:
    tf.config.experimental.set_virtual_device_configuration(
        gpus[0],
        [tf.config.experimental.VirtualDeviceConfiguration(memory_limit=1024)]

Run Code Online (Sandbox Code Playgroud)

对于Tensorflow 2.0，这个解决方案对我有用。（TF-GPU 2.0、Windows 10、GeForce RTX 2070）

physical_devices = tf.config.experimental.list_physical_devices('GPU')
assert len(physical_devices) > 0, "Not enough GPU hardware devices available"
tf.config.experimental.set_memory_growth(physical_devices[0], True)

Run Code Online (Sandbox Code Playgroud)

归档时间：	10 年，1 月前
查看次数：	134852 次
最近记录：	6 年，2 月前

如何检查变量是否存在？ 849

为什么有些浮点数<整数比较慢四倍？ 283

Python pandas从一列字符串的数据选择中过滤出nan 156

如何在身份验证代理后面的窗口上使用pip 78

什么时候在Django中使用get,get_queryset,get_context_data？ 55

Python问题:迄今为止的年份和年份？ 47

如何迭代参数 45

使用TensorFlow进行图像相似性检测 5

针对 Tensorflow 2.0 调整 Tensorflow RNN Seq2Seq 模型代码 5

结合条件和控制依赖 1

使用Git将最近的提交移动到新分支 4647

如何在JavaScript中将字符串转换为布尔值？ 2328

有没有办法对字符串进行子串？ 1995

没有jQuery的$(document).ready等价 1925

CSS三角形如何工作？ 1791

什么是非捕获组？(？:)做什么？ 1653

我在哪里将'assets'文件夹放在Android Studio中？ 1366

修复一个Git分离的头？ 1318

从字典中删除元素 1243

确定两个日期范围是否重叠 1180