深度学习中的训练损失和验证损失

Moh*_*ard 8 machine-learning deep-learning

请您指导我如何解释以下结果？

1) 损失 < 验证损失 2) 损失 > 验证损失

似乎训练损失总是应该小于验证损失。但是，这两种情况在训练模型时都会发生。

真的是机器学习中的一个基本问题。

If validation loss >> training loss you can call it overfitting.
If validation loss  > training loss you can call it some overfitting.
If validation loss  < training loss you can call it some underfitting.
If validation loss << training loss you can call it underfitting.

Run Code Online (Sandbox Code Playgroud)

您的目标是使验证损失尽可能低。一些过拟合几乎总是一件好事。最后重要的是：验证损失是否尽可能低。

这通常发生在训练损失相当低的时候。

还要检查如何防止过度拟合。

在机器学习和深度学习中基本上有三种情况

1) 欠拟合

这是唯一一个loss>validation_loss的情况，但只是轻微的，如果loss远高于validation_loss，请贴出你的代码和数据，让我们看看

2) 过拟合

损失<<验证损失

这意味着您的模型非常适合训练数据，但根本不适用于验证数据，换句话说，它不能正确地泛化到看不见的数据

3) 完美贴合

损失 == 验证损失

如果两个值最终大致相同，并且值正在收敛（绘制随时间的损失），那么您做对的可能性非常高

1）您的模型在训练数据上的表现比在未知验证数据上的表现更好。有点过度拟合是正常的，但需要使用 dropout 等技术来调节更高的拟合量，以确保泛化。

2) 您的模型在验证数据上表现更好。当您对训练数据使用增强时，可能会发生这种情况，与未修改的验证样本相比，这使得预测变得更加困难。当您的训练损失计算为 1 个时期的移动平均值，而验证损失是在同一时期的学习阶段之后计算时，也可能会发生这种情况。

归档时间：	7 年，10 月前
查看次数：	36489 次
最近记录：	4 年，9 月前

神经网络的逼近函数 22

如何训练不包含对象的 Tensorflow 对象检测图像？ 8

如何使用 tf.keras.Model.summary 查看父模型中子模型的层？ 8

如何确定要在卷积神经网络层中使用的特征图的数量？ 6

随机化输入顺序对神经网络的影响 5

如何在Keras中累积大批量的梯度 5

让 TensorFlow 在 ARM Mac 上使用 GPU 5

如何实现 LSTM 层之间的跳跃连接结构 3

如何在TensorFlow的MNIST示例中获得预测的类标签？ 2

TypeError：__call __（）缺少1个必需的位置参数：“ inputs” 2

如何水平居中<div>？ 4116

为什么我不应该在PHP中使用mysql_*函数？ 2432

数据库索引如何工作？ 2335

在不应用它的情况下查看存储中的内容 1650

在JavaScript中生成随机字符串/字符 1593

如何在所有浏览器中控制网页缓存？ 1474

为什么我需要一直做`--set-upstream`？ 1364

Android中的gravity和layout_gravity有什么区别？ 1286

Django会扩展吗？ 1101

为什么使用'=='或'is'比较字符串有时会产生不同的结果？ 1076