小编gwa*_*nim的帖子

为什么具有零数据集的 XGBoost 返回非零预测?

我最近使用scikit-learn RandomForestRegressor模型开发了一个功能齐全的随机森林回归软件,现在我有兴趣将其性能与其他库进行比较。所以我找到了一个用于 XGBoost 随机森林回归scikit-learn API,我用 X 特征和全零的 Y 数据集做了一个小的软件测试。

from numpy import array
from xgboost import XGBRFRegressor
from sklearn.ensemble import RandomForestRegressor


tree_number = 100
depth = 10
jobs = 1
dimension = 19
sk_VAL = RandomForestRegressor(n_estimators=tree_number, max_depth=depth, random_state=42,
                               n_jobs=jobs)
xgb_VAL = XGBRFRegressor(n_estimators=tree_number, max_depth=depth, random_state=42,
                         n_jobs=jobs)
dataset = array([[0.0] * dimension, [0.0] * dimension])
y_val = array([0.0, 0.0])

sk_VAL.fit(dataset, y_val)
xgb_VAL.fit(dataset, y_val)
sk_predict = sk_VAL.predict(array([[0.0] * dimension]))
xgb_predict = xgb_VAL.predict(array([[0.0] * dimension]))
print("sk_prediction = {}\nxgb_prediction …
Run Code Online (Sandbox Code Playgroud)

python machine-learning xgboost

8
推荐指数
1
解决办法
180
查看次数

标签 统计

machine-learning ×1

python ×1

xgboost ×1