如何研究每个数据对深层神经网络模型的影响?

sak*_*ami 5 python machine-learning training-data neural-network keras

我正在使用Python和Keras库来训练神经网络模型.

我的模型测试精度非常低(60.0%),我尝试了很多来提升它,但我做不到.我正在使用DEAP数据集(共32个参与者)来训练模型.我正在使用的分裂技术是固定的.它如下:28名参与者进行培训,2名参加验证,2名参加测试.

对于我正在使用的模型如下.

  • 顺序模型
  • 优化者=亚当
  • 使用L2_regularizer,高斯噪声,丢失和批量归一化
  • 隐藏层数= 3
  • 激活= relu
  • 编译损失= categorical_crossentropy
  • initializer = he_normal

现在,我正在使用列车测试技术(也修一个)来分割数据,我得到了更好的结果.但是,我发现有些参与者以负面的方式影响了培训的准确性.因此,我想知道是否有办法研究每个数据(参与者)对模型准确性(性能)的影响?

最好的祝福,

Pio*_*dal 0

从我的《开始深度学习实践:CIFAR-10 图像分类》教程中,我坚持跟踪两者:

  • 全局指标(对数损失、准确性),
  • 示例(正确和错误分类案例)。

后者可能帮助我们判断哪些模式有问题,并且在很多情况下帮助我更改网络(或补充训练数据,如果是这种情况)。

示例它是如何工作的(这里使用Neptune,尽管您可以在 Jupyter Notebook 中手动执行此操作,或使用TensorBoard图像通道):

神经网络错误分类的图像 - Neptune

然后查看特定示例以及预测概率:

在此输入图像描述

完整免责声明:我与 deepsense.ai、创建者或Neptune - 机器学习实验室合作。