比使用Tensorflow和Keras的培训准确性更高的验证准确性

Question

比使用Tensorflow和Keras的培训准确性更高的验证准确性

Jas*_*per 24 classification machine-learning neural-network keras tensorflow

我正在尝试使用深度学习来预测来自约会网站的15个自我报告属性的收入.

我们得到的结果相当奇怪,我们的验证数据比我们的训练数据更准确,损失更低.这在不同大小的隐藏层中是一致的.这是我们的模型:

for hl1 in [250, 200, 150, 100, 75, 50, 25, 15, 10, 7]:
    def baseline_model():
        model = Sequential()
        model.add(Dense(hl1, input_dim=299, kernel_initializer='normal', activation='relu', kernel_regularizer=regularizers.l1_l2(0.001)))
        model.add(Dropout(0.5, seed=seed))
        model.add(Dense(3, kernel_initializer='normal', activation='sigmoid'))

        model.compile(loss='categorical_crossentropy', optimizer='adamax', metrics=['accuracy'])
        return model

    history_logs = LossHistory()
    model = baseline_model()
    history = model.fit(X, Y, validation_split=0.3, shuffle=False, epochs=50, batch_size=10, verbose=2, callbacks=[history_logs])

Run Code Online (Sandbox Code Playgroud)

这就是准确性和损失的一个示例: 精度与250个神经元的隐含层和损失.

我们试图消除正规化和辍学,这正如预期的那样,以过度拟合结束(培训acc:~85%).我们甚至尝试用相似的结果大幅降低学习率.

有没有人见过类似的结果？

Answer 1

yhe*_*non 48

当您使用时会发生这种情况Dropout,因为训练和测试时的行为是不同的.

训练时,一部分功能设置为零(自您使用以来,在您的情况下为50%Dropout(0.5)).测试时,使用所有功能(并进行适当缩放).因此,测试时的模型更加稳健 - 并且可以提高测试精度.

所以您说，如果val_acc高于trn_acc可以吗？ (3认同)
@yhenon 我在构建模型时也会观察。但我想知道使用 dropout 时这**保证**会发生吗？这背后有什么理论依据吗？ (3认同)
测试错误不如训练错误的好解释！现在位于Keras的常见问题解答中https://keras.io/getting-started/faq/#why-is-the-training-loss-much-higher-than-the-testing-loss，但是最初的问题是关于验证准确性高于训练准确性，或者验证错误低于训练错误。 (2认同)