我在Python中创建了一个xgboost分类器:
train是一个熊猫数据框,具有10万行和50列特征。目标是熊猫系列
xgb_classifier = xgb.XGBClassifier(nthread=-1, max_depth=3, silent=0,
objective='reg:linear', n_estimators=100)
xgb_classifier = xgb_classifier.fit(train, target)
predictions = xgb_classifier.predict(test)
Run Code Online (Sandbox Code Playgroud)
但是,经过训练后,当我使用此分类器预测值时,整个结果数组将是相同的数字。知道为什么会这样吗?
数据澄清:带有数字目标的〜50个数字特征
我还使用相同的数据尝试了sklearn的RandomForest回归,它确实给出了真实的预测。也许是xgboost实现中的合法错误?