小编use*_*509的帖子

LIBSVM 过拟合

在进行 10 倍交叉验证并找到 gamma 和 C(RBF 核)的最佳参数值后,我用 15451 个样本训练了两个 svm (LIBSVM)。在一个 svm 中,我只使用了 1 个特征,在第二个中,我又使用了一个特征(以查看这一附加特征是否改善了预测)。CV 后,我的准确度为 75%(具有一项特征的 SVM)和 77%(具有附加一项特征的 SVM)。在对另外 15451 个实例进行测试后,我的准确率分别为 70% 和 72%。

我知道这称为过度拟合,但这在这里很重要吗,因为只有 5% 的差异。

我可以做什么来避免过度拟合?

仅使用一两个特征和相对较大的训练集是否更好?

希望你能帮助我。

machine-learning svm libsvm cross-validation

5
推荐指数
1
解决办法
1280
查看次数

标签 统计

cross-validation ×1

libsvm ×1

machine-learning ×1

svm ×1