Keras 在 epoch 结束之前评估验证数据

Jud*_*AYE 5 neural-network deep-learning keras tensorflow tf.keras

我想用 Keras 训练我的模型。我正在使用一个巨大的数据集,其中一个训练周期有超过 30000 个步骤。我的问题是,我不想在检查验证数据集上的模型改进之前等待一个纪元。有没有办法让 Keras 每 1000 步训练数据评估一次验证数据?我认为一种选择是使用回调,但是 Keras 有内置的解决方案吗?

if train:
    log('Start training')
    history = model.fit(train_dataset,
                      steps_per_epoch=train_steps,
                      epochs=50,
                      validation_data=val_dataset,
                      validation_steps=val_steps,
                      callbacks=[
                            keras.callbacks.EarlyStopping(
                                monitor='loss',
                                patience=10,
                                restore_best_weights=True,
                            ),
                            keras.callbacks.ModelCheckpoint(
                                filepath=f'model.h5',
                                monitor='val_loss',
                                save_best_only=True,
                                save_weights_only=True,
                            ),
                            keras.callbacks.ReduceLROnPlateau(
                                monitor = "val_loss", 
                                factor = 0.5, 
                                patience = 3, 
                                min_lr=0.001,
                            ),
                        ],
                )
Run Code Online (Sandbox Code Playgroud)

Tim*_*lin 6

使用内置回调,您无法做到这一点。您需要的是实现自定义回调。

class MyCustomCallback(tf.keras.callbacks.Callback):

  def on_train_batch_begin(self, batch, logs=None):
    print('Training: batch {} begins at {}'.format(batch, datetime.datetime.now().time()))

  def on_train_batch_end(self, batch, logs=None):
    print('Training: batch {} ends at {}'.format(batch, datetime.datetime.now().time()))

  def on_test_batch_begin(self, batch, logs=None):
    print('Evaluating: batch {} begins at {}'.format(batch, datetime.datetime.now().time()))

  def on_test_batch_end(self, batch, logs=None):
    print('Evaluating: batch {} ends at {}'.format(batch, datetime.datetime.now().time()))
Run Code Online (Sandbox Code Playgroud)

这取自 TensorFlow 文档。

您可以重写该on_train_batch_end()函数,并且由于批处理参数是整数,因此您可以根据需要验证batch % 100 == 0,然后等等。self.model.predict(val_data)

请在这里检查我的答案:How to get othermetrics in Tensorflow 2.0 (不仅仅是准确性)? 对如何重写自定义回调函数有一个很好的概述。请注意,就您的情况而言,重要的是on_train_batch_end()on_epoch_end()