神经网络嵌入在kNN分类器中的性能评估

kam*_*pta 5 classification representation knn neural-network deep-learning

我正在解决分类问题.我为一组实体训练我的无监督神经网络(使用skip-gram架构).

我评估方法是搜索k个最近的邻居在验证数据的每个点,从训练数据.我采用最近邻居的标签的加权和(基于距离的权重)并使用每个验证数据点的得分.

观察 - 当我增加时期的数量(model1- 600个时期,model 2- 1400个时期和model 3- - 2000个时期)时,我的AUC在较小的值处改善k但在相似的值处饱和.

什么可能解释这种行为?

在此输入图像描述

[转载自CrossValidated]

Out*_*ier 0

要交叉检查不平衡类是否是一个问题,请尝试拟合 SVM 模型。如果这给出了更好的分类(如果您的人工神经网络不是很深,则可能),则可能会得出结论,应该首先平衡类别。

另外,尝试一些核函数来检查这种转换是否使数据线性可分?