使用自定义Estimator的Tensorflow指标

stu*_*art 3 python tensorflow

我有一个卷积神经网络,我最近重构使用Tensorflow的Estimator API,很大程度上遵循本教程.但是,在训练期间,我添加到EstimatorSpec的度量标准没有显示在Tensorboard上,并且似乎没有在tfdbg中进行评估,尽管名称范围和度量标准存在于写入Tensorboard的图表中.

相关位model_fn如下:

 ...

 predictions = tf.placeholder(tf.float32, [num_classes], name="predictions")

 ...

 with tf.name_scope("metrics"):
    predictions_rounded = tf.round(predictions)
    accuracy = tf.metrics.accuracy(input_y, predictions_rounded, name='accuracy')
    precision = tf.metrics.precision(input_y, predictions_rounded, name='precision')
    recall = tf.metrics.recall(input_y, predictions_rounded, name='recall')

if mode == tf.estimator.ModeKeys.PREDICT:
    spec = tf.estimator.EstimatorSpec(mode=mode,
                                      predictions=predictions)
elif mode == tf.estimator.ModeKeys.TRAIN:

    ...

    # if we're doing softmax vs sigmoid, we have different metrics
    if cross_entropy == CrossEntropyType.SOFTMAX:
        metrics = {
            'accuracy': accuracy,
            'precision': precision,
            'recall': recall
        }
    elif cross_entropy == CrossEntropyType.SIGMOID:
        metrics = {
            'precision': precision,
            'recall': recall
        }
    else:
        raise NotImplementedError("Unrecognized cross entropy function: {}\t Available types are: SOFTMAX, SIGMOID".format(cross_entropy))
    spec = tf.estimator.EstimatorSpec(mode=mode,
                                      loss=loss,
                                      train_op=train_op,
                                      eval_metric_ops=metrics)
else:
    raise NotImplementedError('ModeKey provided is not supported: {}'.format(mode))

return spec
Run Code Online (Sandbox Code Playgroud)

任何人都有任何想法为什么这些没有写?我正在使用Tensorflow 1.7和Python 3.5.我已经尝试过明确地添加它们tf.summary.scalar,虽然它们确实以这种方式进入Tensorboard,但是在第一次通过图形之后它们永远不会更新.

Dav*_*rks 6

指标API有一个扭曲,让我们以tf.metrics.accuracy一个例子(所有tf.metrics.*工作相同).这会返回2个值,accuracy指标和upate_op,这看起来像是你的第一个错误.你应该有这样的东西:

accuracy, update_op = tf.metrics.accuracy(input_y, predictions_rounded, name='accuracy')
Run Code Online (Sandbox Code Playgroud)

accuracy只是您希望计算的值,但请注意,您可能希望计算多次调用的准确性sess.run,例如,当您计算不完全适合内存的大型测试集的准确性时.这就是update_op进入的地方,它会产生结果,因此当你要求accuracy它时会给你一个运行记录.

update_op没有依赖项,因此您需要显式运行它sess.run或添加依赖项.例如,您可以将其设置为依赖于成本函数,以便在计算成本函数时update_op计算(导致运行计数以更新准确性):

with tf.control_dependencies(cost):
  tf.group(update_op, other_update_ops, ...)
Run Code Online (Sandbox Code Playgroud)

您可以使用局部变量初始值设定项重置度量标准的值:

sess.run(tf.local_variables_initializer())
Run Code Online (Sandbox Code Playgroud)

tf.summary.scalar(accuracy)正如你所提到的那样,你需要为tensorboard添加精度(虽然看起来你添加了错误的东西).