我正在研究具有 10 个类别(从 0 到 10 的数字)的手语数字数据集的图像分类问题。由于某种原因,我的模型高度过度拟合,尽管我尝试了简单的模型(如 1 个卷积层)、经典的 ResNet50 甚至最先进的 NASNetMobile。
图像是彩色的,大小为 100x100。我尝试调整学习率,但它没有多大帮助,尽管减少批量大小会导致 val 准确性的早期增加。
我对图像应用了增强,但也没有帮助:当 val 精度不能高于 0.6 时,我的训练精度可以达到 1.0。
我查看了数据,它似乎加载得很好。验证集中的类分布也是公平的。我总共有 2062 张图片。
当我将损失更改为binary_crossentropy它时,它似乎可以为训练准确度和 val 准确度提供更好的结果,但这似乎并不正确。
我不明白出了什么问题,你能帮我找出我错过了什么吗?谢谢你。
这是我的笔记本的链接:单击