SVM的gamma和cost参数

Pei*_*yun 2 machine-learning svm libsvm

大家,这是一个奇怪的现象,当我使用libSVM做一些预测时.

当我没有设置SVM参数时,我将在测试集上获得99.9%的性能.然而,如果我设置参数'-c 10 -g 5',我将在测试集上获得大约33%的精度.

顺便说一下,我使用的SVM工具包是LibSVM.

我想知道数据集是否有问题.我无法弄清楚哪个结果更有说服力.

Mar*_*sen 10

您恰好遇到了一个问题,其默认值为,C并且运行gamma良好(分别为1和1/num_features).

gamma=5明显大于默认值.gamma=5当默认值接近最优时,导致非常差的结果是完全合理的.大型gamma和大型的组合C是过度拟合的完美配方(例如,高训练集性能和低测试集性能).

  • 评估训练集上的分类器实际上是一个好主意(只要你也在验证集和测试集上进行!)因为它可以帮助你判断更多的训练数据或更好的特征是否有助于获得更好的模型,但是这超出了问题的范围. (2认同)