相关疑难解决方法(0)

如何使用spark-ml处理分类功能?

如何处理与分类数据 spark-ml ,而不是 spark-mllib

认为文档不是很清楚,似乎分类器例如RandomForestClassifier,LogisticRegression有一个featuresCol参数,它指定了特征列的名称DataFrame,以及一个labelCol参数,它指定了标记类的列的名称DataFrame.

显然我想在我的预测中使用多个功能,所以我尝试使用VectorAssembler将所有功能放在一个向量下featuresCol.

但是,VectorAssembler只接受数字类型,布尔类型和矢量类型(根据Spark网站),所以我不能在我的特征向量中添加字符串.

我该怎么办?

categorical-data apache-spark apache-spark-ml apache-spark-mllib

38
推荐指数
3
解决办法
4万
查看次数