如何在tf.estimator的input_fn中使用tf.data的可初始化迭代器?

gui*_*kln 10 python tensorflow tensorflow-datasets tensorflow-estimator

我想管理我的培训tf.estimator.Estimator但是在tf.dataAPI 旁边使用它有些麻烦.

我有这样的事情:

def model_fn(features, labels, params, mode):
  # Defines model's ops.
  # Initializes with tf.train.Scaffold.
  # Returns an tf.estimator.EstimatorSpec.

def input_fn():
  dataset = tf.data.TextLineDataset("test.txt")
  # map, shuffle, padded_batch, etc.

  iterator = dataset.make_initializable_iterator()

  return iterator.get_next()

estimator = tf.estimator.Estimator(model_fn)
estimator.train(input_fn)
Run Code Online (Sandbox Code Playgroud)

因为我不能使用一个make_one_shot_iterator用于我的用例,我的问题是input_fn包含一个应该在其中初始化的迭代器model_fn(这里,我tf.train.Scaffold用来初始化本地操作).

此外,我明白我们不能只使用input_fn = iterator.get_next其他ops将不会添加到同一图表.

初始化迭代器的推荐方法是什么?

gui*_*kln 13

从TensorFlow 1.5开始,可以input_fn返回a tf.data.Dataset,例如:

def input_fn():
  dataset = tf.data.TextLineDataset("test.txt")
  # map, shuffle, padded_batch, etc.
  return dataset
Run Code Online (Sandbox Code Playgroud)

c294fcfd.


对于以前的版本,您可以在tf.GraphKeys.TABLE_INITIALIZERS集合中添加迭代器的初始化程序,并依赖于默认的初始化程序.

tf.add_to_collection(tf.GraphKeys.TABLE_INITIALIZERS, iterator.initializer)
Run Code Online (Sandbox Code Playgroud)