Tensorflow 数据集 API：缓存

Sha*_*rny 6 caching dataset tensorflow

我正在尝试使用 tf.Dataset.cache 但它似乎没有影响。

我有3个问题请教：

你想在什么时候缓存你的数据集？我假设它将在任何具有随机行为的映射操作之前。是否建议在任何其他映射之前从 TFRecord 文件进行初始解析后缓存数据集？
如何衡量缓存对速度优化的影响？
我会假设我总是想将我的图像缓存到内存中。至少其中的一部分，并让管道更快地馈送网络。我什么时候要缓存到文件？

谢谢！

.cache 函数的目的是通过将样本缓存到内存/磁盘空间来加速数据管道。因此，对于初始纪元之后的所有纪元，您的管道将不再需要读取/解析/处理。话虽如此，通常最好将其放在数据管道的末尾。
您可以为第一个纪元和第二个纪元计时，看看速度是否有所提高。
当您的图像太大而无法装入内存时。但磁盘 I/O 也需要时间。您需要确保您的管道处理花费的时间比这要长，这样才能发挥作用。

归档时间：	8 年，2 月前
查看次数：	1363 次
最近记录：	6 年，9 月前

从tf.train.AdamOptimizer获取当前的学习率 27

防止角度模板的浏览器缓存 10

在Rails生产中删除缓存Busting 9

分析缓存Evicition 7

限制TensorFlow RAM的使用 5

对象检测API断言失败：[最大框坐标值大于1.01：] 5

循环时在tensoflow会话中更改常量 4

Tensorflow2.0 训练：model.compile vs GradientTape 4

Tensorflow：是否可以在检查点中修改全局步骤 2

使用 Keras 训练 CNN-LSTM 时卡在第一个 epoch 1

如何撤消Git中最近的提交？ 20327

如何让Git"忘记"一个被跟踪但现在位于.gitignore的文件？ 4888

Python有一个字符串'contains'子串方法吗？ 3601

在函数中使用全局变量 2939

Flash CS4拒绝放手 2735

如何克隆或复制列表？ 2289

将字符串转换为datetime 2035

编译用于高放射性环境的应用程序 1414

Android SDK安装找不到JDK 1185

有哪些常用的命名git分支实例的例子？ 1034