我想更新我的pyspark代码。在pyspark中,必须将基础模型放入管道中,管道的办公演示使用LogistictRegression作为基础模型。但是,似乎无法在管道API中使用XGboost模型。我该如何使用pyspark
from xgboost import XGBClassifier
...
model = XGBClassifier()
model.fit(X_train, y_train)
pipeline = Pipeline(stages=[..., model, ...])
...
Run Code Online (Sandbox Code Playgroud)
使用管道API很方便,因此有人可以提出建议吗?谢谢。
apache-spark pyspark apache-spark-ml apache-spark-mllib xgboost