我有一个包含 36540 行的数据框。目标是预测y HITS_DAY。
#数据
https://github.com/soufMiashs/Predict_Hits
我正在尝试训练非线性回归模型,但模型似乎并没有学到太多东西。
X_train, X_test, y_train, y_test = train_test_split(x, y, test_size=0.20, random_state=42)
data_dmatrix = xgb.DMatrix(data=x,label=y)
xg_reg = xgb.XGBRegressor(learning_rate = 0.1, objectif='reg:linear', max_depth=5,
n_estimators = 1000)
xg_reg.fit(X_train,y_train)
preds = xg_reg.predict(X_test)
df=pd.DataFrame({'ACTUAL':y_test, 'PREDICTED':preds})
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?