将 LightGBM 与多输出回归器和评估集结合使用

use*_*698 8 python machine-learning scikit-learn lightgbm

我正在尝试按照此处的建议使用 LightGBM 作为多输出预测器。我正在尝试预测连续三十天的值。我有一个面板数据集,所以我无法使用传统的时间序列方法。

我有一个非常大的数据集,因此在不提前停止的情况下训练模型需要很长时间。因此,我尝试传递eval_set,early_stopping_roundseval_metric参数,如下所示:

from lightgbm import LGBMRegressor
from sklearn.multioutput import MultiOutputRegressor

hyper_params = {
    'task': 'train',
    'boosting_type': 'gbdt',
    'objective': 'regression',
    'metric': ['l1','l2'],
    'learning_rate': 0.01,
    'feature_fraction': 0.9,
    'bagging_fraction': 0.7,
    'bagging_freq': 10,
    'verbose': 0,
    "max_depth": 8,
    "num_leaves": 128,  
    "max_bin": 512,
    "num_iterations": 10000
}

lgbc_fit_params = { 
    'early_stopping_rounds' : 300,
    'eval_set': (X_test, y_test_array),
    'eval_metric':'l1'
}

gbm = lgb.LGBMRegressor(**hyper_params)
regr_multiglb = MultiOutputRegressor(gbm)
regr_multiglb.fit(X_train, y_train_array, **lgbc_fit_params)
Run Code Online (Sandbox Code Playgroud)

这里, 和y_train_array都是形状分别为和 的y_test_array 二维 numpy 数组。(1953395, 30)(331003, 30)

当我运行此代码时,出现以下错误:

错误信息

当我在没有 的情况下运行 fit 函数时**lgbc_fit_parameters,代码运行时没有错误。

关于如何将基本估计器 (LightGBM) 拟合参数传递到包装器中,有什么建议吗?

小智 0

它在错误照片中清楚地显示您的标签意味着 y_test 和 y_test 是列表、一维数组或熊猫系列的形式,但您给出了多维数组