支持向量机:什么是 C 和 Gamma?

Age*_*ntX 4 machine-learning svm

我是机器学习的新手 7 我已经开始关注 Udacity 的机器学习简介

当这个概念C and Gamma出现时,我正在关注简单向量机。我做了一些挖掘,发现了以下内容:

C - 高 C 尝试将训练数据的错误分类最小化,而低值尝试保持平滑分类。这对我来说很有意义。

Gamma - 我无法理解这个。

有人可以用外行的术语向我解释这一点吗?

lan*_*nok 7

当您使用 SVM 时,您必须使用内核之一:线性、多项式或 RBF=径向基函数(也称为高斯内核)或其他任何内核。后者是

K(x,x') = exp(-gamma * ||x-x'||^2) 
Run Code Online (Sandbox Code Playgroud)

其中明确包含您的伽玛。伽马越大,高斯“钟”越窄。

我相信,随着课程的进行,您将更多地了解这种“内核技巧”。


小智 6

-C参数:C决定了允许将多少个数据样本放在不同的类中。如果将C的值设置为较低的值,则异常值的概率会增加,并且可以找到一般的决策边界。如果 C 的值设置得较高,则可以更仔细地找到决策边界。

C用于soft margin,需要了解松弛变量。

-软边距分类器:
文本

- 松弛变量文本确定调整多少余量。

gamma参数:gamma决定单个数据样本产生影响的距离。也就是说,gamma参数可以说是调整决策边界的曲率。


Use*_*erX 5

直观地说,gamma 参数定义了单个训练示例的影响范围,低值表示“远”,高值表示“接近”。伽马参数可以看作是模型选择的样本作为支持向量的影响半径的倒数。C 参数在训练示例的错误分类与决策表面的简单性之间进行权衡。低 C 使决策表面平滑,而高 C 旨在通过让模型自由选择更多样本作为支持向量来正确分类所有训练示例。 http://scikit-learn.org/stable/auto_examples/svm/plot_rbf_parameters.html