小编mah*_*h65的帖子

获取pyspark中分类后的所有评估指标

我已经训练了一个模型,想要计算几个重要的指标,例如accuracy、、 和。precisionrecallf1 score

我遵循的过程是:

from pyspark.ml.classification import LogisticRegression

lr = LogisticRegression(featuresCol='features',labelCol='label')
lrModel = lr.fit(train)
lrPredictions = lrModel.transform(test)

from pyspark.ml.evaluation import MulticlassClassificationEvaluator
from pyspark.ml.evaluation import BinaryClassificationEvaluator

eval_accuracy = MulticlassClassificationEvaluator(labelCol="label", predictionCol="prediction", metricName="accuracy")
eval_precision = MulticlassClassificationEvaluator(labelCol="label", predictionCol="prediction", metricName="precision")
eval_recall = MulticlassClassificationEvaluator(labelCol="label", predictionCol="prediction", metricName="recall")
eval_f1 = MulticlassClassificationEvaluator(labelCol="label", predictionCol="prediction", metricName="f1Measure")

eval_auc = BinaryClassificationEvaluator(labelCol="label", rawPredictionCol="prediction")

accuracy = eval_accuracy.evaluate(lrPredictions)
precision = eval_precision.evaluate(lrPredictions)
recall = eval_recall.evaluate(lrPredictions)
f1score = eval_f1.evaluate(lrPredictions)

auc = eval_accuracy.evaluate(lrPredictions)
Run Code Online (Sandbox Code Playgroud)

然而,它只能计算accuracyauc,而不能计算其他三个。这里我应该修改什么?

machine-learning pyspark apache-spark-ml multiclass-classification

2
推荐指数
1
解决办法
8074
查看次数

如何让pyinstaller不使用anaconda并构建一个小尺寸的exe文件

我一直在尝试在 Windows 10 中使用 pyinstaller 构建 .exe 文件。它起作用了,但 exe 文件的大小约为 212 MB,即使使用 venv(如此处所示)。我想可能是因为我正在使用 anaconda 的 python!

然后我安装了一个单独的 Python 版本,所以不使用 anaconda!但它不起作用(仍然是大文件)。

然后我卸载了anaconda进行测试。Pyinstaller 仍在尝试访问“C:\Program Files\anaconda3\python.exe”中的Python (此错误:“C:\Program Files\anaconda3\python.exe”中没有 Python)。但是我已经删除了 anaconda 的所有路径。可能它一直试图访问 anaconda,这就是为什么我没有成功构建一个小尺寸的 .exe 文件。

如何清楚地指示 pyinstaller 和 python 的路径?

python pyinstaller anaconda conda

1
推荐指数
1
解决办法
3827
查看次数