线性SVM模型的权重(在R中)?

Ken*_*ams 5 r svm

使用kernlab我训练了一个模型,其代码如下:

my.model <- ksvm(result ~ f1+f2+f3, data=gold, kernel="vanilladot")
Run Code Online (Sandbox Code Playgroud)

由于它是一个线性模型,我更喜欢在运行时将得分计算为特征值的简单加权和,而不是使用完整的SVM机制.如何将模型转换为类似的东西(这里有一些组成的权重):

> c(.bias=-2.7, f1=0.35, f2=-0.24, f3=2.31)
.bias    f1    f2    f3 
-2.70  0.35 -0.24  2.31 
Run Code Online (Sandbox Code Playgroud)

.bias偏差项在哪里,其余是特征权重?

编辑:

这是一些示例数据.

gold <- structure(list(result = c(-1, -1, -1, -1, -1, -1, -1, -1, -1, 
-1, -1, -1, -1, -1, -1, -1, -1, -1, -1, -1, 1, 1, 1, 1, 1, 1, 
1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1), f1 = c(0, 0, 0, 0, 
0, 0, 0, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0, 0, 
1, 0, 0, 0, 0, 0, 0, 1, 0, 1, 1, 0, 0, 0, 1), f2 = c(13.4138113499447, 
13.2216999857095, 12.964145772169, 13.1975227965938, 13.1031520152764, 
13.59351759447, 13.1031520152764, 13.2700658838026, 12.964145772169, 
13.1975227965938, 12.964145772169, 13.59351759447, 13.59351759447, 
13.0897162110721, 13.364151238365, 12.9483051847806, 12.964145772169, 
12.964145772169, 12.964145772169, 12.9483051847806, 13.0937231331592, 
13.5362700880482, 13.3654209223623, 13.4356400945176, 13.59351759447, 
13.2659406408724, 13.4228886221088, 13.5103065354936, 13.5642812689161, 
13.3224757352068, 13.1779418771704, 13.5601730479315, 13.5457299603578, 
13.3729010596517, 13.4823595997866, 13.0965264603473, 13.2710281801434, 
13.4489887206797, 13.5132372154748, 13.5196188787197), f3 = c(0, 
1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 
0, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0)), .Names = c("result", 
"f1", "f2", "f3"), class = "data.frame", row.names = c(NA, 40L
))
Run Code Online (Sandbox Code Playgroud)

dma*_*oni 7

要获得偏差,只需使用全零的特征向量评估模型.要获得第一个特征的系数,请使用第一个位置为"1"的特征向量评估模型,并在其他任何位置使用零 - 然后减去您已知的偏差.我担心我不知道R语法,但从概念上讲你想要这样的东西:

bias = my.model.eval([0, 0, 0])
f1 = my.model.eval([1, 0, 0]) - bias
f2 = my.model.eval([0, 1, 0]) - bias
f3 = my.model.eval([0, 0, 1]) - bias
Run Code Online (Sandbox Code Playgroud)

要测试你是否正确地做了,你可以尝试这样的事情:

assert(bias + f1 + f2 + f3 == my.model.eval([1, 1, 1]))
Run Code Online (Sandbox Code Playgroud)


Ste*_*lou 5

如果我没记错的话,我想你是在问如何提取SVM的W向量,其中W定义为:

W = \sum_i y_i * \alpha_i * example_i
Run Code Online (Sandbox Code Playgroud)

gh:这里不知道写方程的最佳方法,但这只是权重*支持向量的总和。计算W后,您可以提取所需特征的“权重”。

假设这是正确的,您将:

  1. 获取作为支持向量的数据索引
  2. 取得体重(阿尔法)
  3. 计算 W

kernlab将支持向量索引及其值存储在列表中(因此它也适用于多类问题),无论如何,对列表操作的任何使用都只是为了获取真实数据(您将看到由...返回的列表的长度)alphaalphaindex仅有1,如果你只是有一个2级的问题,我假设你这样做)。

my.model <- ksvm(result ~ f1+f2+f3, data=gold, kernel="vanilladot", type="C-svc")
alpha.idxs <- alphaindex(my.model)[[1]]  # Indices of SVs in original data
alphas <- alpha(my.model)[[1]]
y.sv <- gold$result[alpha.idxs]
# for unscaled data
sv.matrix <- as.matrix(gold[alpha.idxs, c('f1', 'f2', 'f3')])
weight.vector <- (y.sv * alphas) %*% sv.matrix
bias <- b(my.model)
Run Code Online (Sandbox Code Playgroud)

kernlab实际上在执行数据操作之前先扩展您的数据。您可以像这样获得(缩放的)权重(我想其中的偏差应为0(?))

weight.vector <- (y.sv * alphas) %*% xmatrix(my.model)[[1]]
Run Code Online (Sandbox Code Playgroud)

如果我理解您的问题,那么您应该得到的是什么。