SVM 中的参数 C 和标准来查找最佳参数

Question

SVM中的成本参数C是什么意思？我的意思是，如果C很大，是否意味着“我不能容忍错误的分类”？

在实验中寻找最佳参数时如何确定范围和步长？

顺便问一下，决定哪个参数更好的标准是什么？交叉验证的错误数量或我们从 SVM 获得的支持向量数量？

Answer 1

什么是C？

SVM 训练解决的优化问题有两项：

C只是这些术语重要性之间的平衡。如果 C 较高，则您会更加重视 (2)，如果 C 较低，您会更加重视 (1)。

如果我只是想要准确的结果，为什么不将 C 设置得很高呢？

术语 (1) 防止过度拟合（非常擅长对训练数据进行分类，但非常不擅长对未见过的测试数据进行分类）

好吧，我只是想要准确的结果，为什么我不把 C 设置得很低呢？

项 (2) 确保训练优化关注训练数据，您不仅仅需要“简单”（L2 意义上的）权重，您还需要能够正确分类训练数据的简单权重。

概括：

训练 SVM 是两个术语的平衡。C 是损失项相对于正则化项的相对重要性。

您的解释中的术语 **(1)** 是否意味着比术语 **(2)** 更强的正则化？如果是这样，这似乎与Sklearn“*C是正则化参数。正则化的强度与C*成反比”相矛盾？ (2认同)