如何使用 TF 2.0 tf.recompute_grad？

Yan*_*kin 6 keras tensorflow

我想使用内存节省梯度（openai/gradient-checkpointing）来减少我的神经网络的 GPU 内存成本，但我发现这在 TF 2.0 中是不可能的，但我也发现我可以使用 tf.recompute_grad 来达到此目的。我在Google上没有找到任何示例或教程，所以我在这里询问。另外，是否可以将其与 tf.keras 一起使用？

归档时间：	6 年，4 月前
查看次数：	509 次
最近记录：	6 年，4 月前

Tensorflow:.ckpt文件和.ckpt.meta和.ckpt.index以及.pb文件之间的关系是什么 23

Keras + Tensorflow奇怪的结果 9

如何绘制 Keras/Tensorflow 子类化 API 模型？ 9

如何在MacOSX上使用pyinstaller打包tensorflow？ 5

如何在tensorflow2.0中的keras模型中使用tf.train.ExponentialMovingAverage 5

在Ubuntu 16.04上使用GPU建立TensorFlow:找不到`GLIBCXX_3.4.20' 3

TensorFlow 使用来自具有多个输出的生成器的数据集进行拟合：无法正确定义形状？ 3

打开使用 Tensorflow 后端的 Keras 模型时出现 NameError 2

tf.nn.fused_batch_norm 返回的方差与 tf.nn.moments 不同 2

重置tensorflow流量指标的变量 1

堆栈和堆的内容和位置是什么？ 7847

按字符串属性值对对象数组进行排序 2535

在GitHub上使用https://时有没有办法跳过密码输入？ 1806

在UITableView中使用自动布局来获取动态单元格布局和可变行高 1477

如何从GET参数中获取值？ 1255

如何完全卸载Node.js,并从头开始重新安装(Mac OS X) 1196

从Docker容器内部,如何连接到本机的本地主机？ 1176

如何使用jQuery按名称选择元素？ 1160

jQuery从下拉列表中获取选定的选项 1067

测量Python中经过的时间？ 1031