反向支持向量机：计算预测

Question

反向支持向量机：计算预测

Ril*_*ley 5 python regression svm scikit-learn

我想知道，考虑到 svm 回归模型的回归系数，是否可以“手动”计算该模型所做的预测。更准确地说，假设：

svc = SVR(kernel='rbf', epsilon=0.3, gamma=0.7, C=64)
svc.fit(X_train, y_train)

Run Code Online (Sandbox Code Playgroud)

那么你可以通过使用非常容易地获得预测

y_pred = svc.predict(X_test)

Run Code Online (Sandbox Code Playgroud)

我想知道如何直接计算得到这个结果。从决策函数开始，其中K是 RBF 核函数，b是截距，α 是对偶系数。

因为我使用 RBF 内核，所以我是这样开始的：

def RBF(x,z,gamma,axis=None):
    return np.exp((-gamma*np.linalg.norm(x-z, axis=axis)**2))


for i in len(svc.support_):
    A[i] = RBF(X_train[i], X_test[0], 0.7)

Run Code Online (Sandbox Code Playgroud)

然后我计算了

np.sum(svc._dual_coef_*A)+svc.intercept_

Run Code Online (Sandbox Code Playgroud)

但是，此计算的结果与的第一项不同y_pred。我怀疑我的推理并不完全正确和/或我的代码不应该是这样，所以如果这不是正确的提问板，我深表歉意。在过去的两个小时里我一直盯着这个问题，所以任何帮助将不胜感激！

更新

经过更多研究，我发现了以下帖子：Replication of scikit.svm.SRV.predict(X)和Calculated Decision Function of SVM Manual。在第一篇文章中，他们讨论了回归，在第二篇文章中讨论了分类，但想法保持不变。在这两种情况下，操作员基本上都在问同样的事情，但是当我尝试实现他们的代码时，我总是在步骤中遇到错误

diff = sup_vecs - X_test

Run Code Online (Sandbox Code Playgroud)

形式的

ValueError: operands could not be broadcast together with shapes 

(number equal to amount of support vectors,7) (number equal to len(Xtest),7)

Run Code Online (Sandbox Code Playgroud)

我不明白为什么支持向量的数量应该等于测试数据的数量。据我了解，情况几乎从未如此。那么，任何人都可以阐明如何更普遍地解决这个问题，即如何改进代码以使其适用于多维数组？

PS 与问题无关，但准确地说：7 是特征的数量。

Answer 1

Dee*_*ini 1

你犯的错误就是在for i in len(svc.support_):这个循环中。

您循环遍历第一个 n_SV（支持向量数量）训练点，而不一定是支持向量。因此只需循环即可svc.support_vectors_获得实际的支持向量。其余代码保持不变。下面我提供了带有更正的代码。

from sklearn import datasets
from sklearn.svm import SVR

# Load the IRIS dataset for demonstration
iris = datasets.load_iris()
X = iris.data
y = iris.target

# Train-test split
X_train, y_train = X[:140], y[:140]
X_test, y_test = X[140:], y[140:]

print(X.shape, X_train.shape, X_test.shape) # prints (150, 4) (140, 4) (10, 4)

# Fit a rbf kernel SVM
svc = SVR(kernel='rbf', epsilon=0.3, gamma=0.7, C=64)
svc.fit(X_train, y_train)

# Get prediction for a point X_test using train SVM, svc
def get_pred(svc, X_test):

    def RBF(x,z,gamma,axis=None):
        return np.exp((-gamma*np.linalg.norm(x-z, axis=axis)**2))

    A = []
    # Loop over all suport vectors to calculate K(Xi, X_test), for Xi belongs to the set of support vectors
    for x in svc.support_vectors_:
        A.append(RBF(x, X_test, 0.7))
    A = np.array(A)

    return (np.sum(svc._dual_coef_*A)+svc.intercept_)

for i in range(X_test.shape[0]):
    print(get_pred(svc, X_test[i]))
    print(svc.predict(X_test[i].reshape(1,-1))) # The same oputput by both

Run Code Online (Sandbox Code Playgroud)

归档时间：	7 年，4 月前
查看次数：	1724 次
最近记录：	7 年，4 月前