Bha*_*lav 1 machine-learning apache-spark-mllib
我在 Spark Mlib 中使用逻辑回归进行分类, spark 中的setLabelCol() 和方法有什么区别?setPredictionCol()
它们是为标签和预测设置非默认列名称的两种方法
setLabelCol(default="label") 用于在训练时设置标签的列名称。EG 当训练二元分类器时,您需要一个包含 1.0 或 0.0 的“标签”。该算法将使用它来训练模型。setPredicionCol(default="prediction") 用于设置评分时模型输出的列名称。EG 上面训练的二元分类器模型将向包含预测输出的 DataFrame 添加一个新列。您可以用来explainParams查看可用的参数、默认值和简要文档。例如
scala> new LogisticRegression().explainParams
res6: String =
...
featuresCol: features column name (default: features)
...
labelCol: label column name (default: label)
...
predictionCol: prediction column name (default: prediction)
probabilityCol: Column name for predicted class conditional probabilities.
...
Run Code Online (Sandbox Code Playgroud)