对 Python 上的每个系数具有特定约束的多元线性回归

Question

对 Python 上的每个系数具有特定约束的多元线性回归

Ben*_*lem 7 python constraints machine-learning linear-regression scikit-learn

我目前正在数据集上运行多元线性回归。起初，我没有意识到我需要限制我的体重；事实上，我需要有特定的正负权重。

更准确地说，我正在做一个评分系统，这就是为什么我的一些变量应该对笔记产生积极或消极的影响。然而，在运行我的模型时，结果不符合我的预期，我的一些“正”变量得到负系数，反之亦然。

例如，假设我的模型是：

y = W0*x0 + W1*x1 + W2*x2

Run Code Online (Sandbox Code Playgroud)

其中 x2 是一个“正”变量，我想将 W2 的约束设为正值！

我一直在寻找关于这个问题的很多东西，但我没有发现任何关于特定权重/系数的约束，我发现的只是将所有系数设置为正数或将它们相加为一。

我正在使用 ScikitLearn 包研究 Python。这就是我获得最佳模型的方式：

def ridge(Xtrain, Xtest, Ytrain, Ytest, position):
    param_grid={'alpha':[0.01 , 0.1, 1, 10, 50, 100, 1000]}
    gs = grid_search.GridSearchCV(Ridge(), param_grid=param_grid, n_jobs=-1, cv=3)
    gs.fit(Xtrain, Ytrain)
    hatytrain = gs.predict(Xtrain)
    hatytest = gs.predict(Xtest)

Run Code Online (Sandbox Code Playgroud)

知道如何为特定变量的系数分配约束吗？定义每个约束可能会很麻烦，但我不知道该怎么做。

Answer 1

Dav*_*ale 10

Scikit-learn 不允许对系数进行此类约束。

但是，如果您实现自己的 estimator ，则可以对系数施加任何约束并通过坐标下降优化损失。在无约束情况下，坐标下降在合理的迭代次数中产生与 OLS 相同的结果。

我编写了一个对线性回归系数施加上限和下限的类。如果需要，您可以将其扩展为使用 Ridge 或 evel Lasso 惩罚：

from sklearn.linear_model.base import LinearModel from sklearn.base import RegressorMixin from sklearn.utils import check_X_y import numpy as np class ConstrainedLinearRegression(LinearModel, RegressorMixin): def __init__(self, fit_intercept=True, normalize=False, copy_X=True, nonnegative=False, tol=1e-15): self.fit_intercept = fit_intercept self.normalize = normalize self.copy_X = copy_X self.nonnegative = nonnegative self.tol = tol def fit(self, X, y, min_coef=None, max_coef=None): X, y = check_X_y(X, y, accept_sparse=['csr', 'csc', 'coo'], y_numeric=True, multi_output=False) X, y, X_offset, y_offset, X_scale = self._preprocess_data( X, y, fit_intercept=self.fit_intercept, normalize=self.normalize, copy=self.copy_X) self.min_coef_ = min_coef if min_coef is not None else np.repeat(-np.inf, X.shape[1]) self.max_coef_ = max_coef if max_coef is not None else np.repeat(np.inf, X.shape[1]) if self.nonnegative: self.min_coef_ = np.clip(self.min_coef_, 0, None) beta = np.zeros(X.shape[1]).astype(float) prev_beta = beta + 1 hessian = np.dot(X.transpose(), X) while not (np.abs(prev_beta - beta)<self.tol).all(): prev_beta = beta.copy() for i in range(len(beta)): grad = np.dot(np.dot(X,beta) - y, X) beta[i] = np.minimum(self.max_coef_[i], np.maximum(self.min_coef_[i], beta[i]-grad[i] / hessian[i,i])) self.coef_ = beta self._set_intercept(X_offset, y_offset, X_scale) return self
Run Code Online (Sandbox Code Playgroud)
例如，您可以使用此类使所有系数非负

from sklearn.datasets import load_boston from sklearn.linear_model import LinearRegression X, y = load_boston(return_X_y=True) model = ConstrainedLinearRegression(nonnegative=True) model.fit(X, y) print(model.intercept_) print(model.coef_)
Run Code Online (Sandbox Code Playgroud)
这会产生类似的输出

-36.99292986145538 [0. 0.05286515 0. 4.12512386 0. 8.04017956 0. 0. 0. 0. 0. 0.02273805 0. ]
Run Code Online (Sandbox Code Playgroud)
您可以看到大多数系数为零。一个普通的 LinearModel 会使它们成为负数：

model = LinearRegression() model.fit(X, y) print(model.intercept_) print(model.coef_)
Run Code Online (Sandbox Code Playgroud)
哪个会回到你身边

36.49110328036191 [-1.07170557e-01 4.63952195e-02 2.08602395e-02 2.68856140e+00 -1.77957587e+01 3.80475246e+00 7.51061703e-04 -1.47575880e+00 3.05655038e-01 -1.23293463e-02 -9.53463555e-01 9.39251272e-03 -5.25466633e-01]
Run Code Online (Sandbox Code Playgroud)
您还可以为您选择的任何系数强加任意界限 - 这就是您的要求。例如，在这个设置中

model = ConstrainedLinearRegression() min_coef = np.repeat(-np.inf, X.shape[1]) min_coef[0] = 0 min_coef[4] = -1 max_coef = np.repeat(4, X.shape[1]) max_coef[3] = 2 model.fit(X, y, max_coef=max_coef, min_coef=min_coef) print(model.intercept_) print(model.coef_)
Run Code Online (Sandbox Code Playgroud)
你会得到一个输出

24.060175576410515 [ 0. 0.04504673 -0.0354073 2. -1. 4. -0.01343263 -1.17231216 0.2183103 -0.01375266 -0.7747823 0.01122374 -0.56678676]
Run Code Online (Sandbox Code Playgroud)
更新。该解决方案可以适用于对系数线性组合（例如它们的总和）的约束——在这种情况下，每个系数的单独约束将在每个步骤中重新计算。这个 Github 要点提供了一个例子。

归档时间：	7 年，10 月前
查看次数：	4733 次
最近记录：	4 年，7 月前