相关疑难解决方法(0)

如何将Spark中的分类变量转换为一组编码为{0,1}的列?

我正在尝试使用Spark MLlib(带Scala)对包含分类变量的数据集执行逻辑回归(LogisticRegressionWithLBFGS).我发现Spark无法使用这种变量.

在R中有一种处理这类问题的简单方法:我在因子(类别)中转换变量,因此R创建一组编码为{0,1}指标变量的列.

我怎样才能用Spark执行此操作?

scala bigdata categorical-data apache-spark apache-spark-mllib

7
推荐指数
2
解决办法
6770
查看次数