小编Tan*_*ark的帖子

在 GridSearchCV 中使用多指标评估

我试图在 GridSearchCV 中使用多个指标。我的项目需要多个指标，包括“准确性”和“f1 分数”。然而，在遵循 sklearn 模型和在线帖子之后，我似乎无法让我的工作。这是我的代码：

from sklearn.model_selection import GridSearchCV
from sklearn.metrics import f1_score
clf = KNeighborsClassifier()

param_grid = {'n_neighbors': range(1,30), 'algorithm': ['auto','ball_tree','kd_tree', 'brute'], 'weights': ['uniform', 'distance'],'p': range(1,5)}

#Metrics for Evualation:
met_grid= ['accuracy', 'f1'] #The metric codes from sklearn

custom_knn = GridSearchCV(clf, param_grid, scoring=met_grid, refit='accuracy', return_train_score=True)

custom_knn.fit(X_train, y_train)
y_pred = custom_knn.predict(X_test)

Run Code Online (Sandbox Code Playgroud)

我的错误发生在custom_knn.fit(X_train,y_train). 此外，如果您注释掉scoring=met_grid, refit='accuracy', return_train_score=True，它就可以工作。这是我的错误：

ValueError: Target is multiclass but average='binary'. Please choose another average setting.

Run Code Online (Sandbox Code Playgroud)

此外，如果您能解释多个指标评估或将我推荐给可以的人，那将不胜感激！
谢谢

python scikit-learn gridsearchcv

Tan*_*ark

2018 12-30

3
推荐指数

1
解决办法

5537
查看次数

什么是混洗分区？

什么是spark.sql.shuffle.partitions更技术意义上的？我见过像这里这样的答案，它说：“配置在混洗数据以进行连接或聚合时使用的分区数。”

这实际上意味着什么？当这个数字更高或更低时，从一个节点到另一个节点的改组如何不同？

谢谢！

partitioning apache-spark pyspark

Tan*_*ark

lucky-day

1
推荐指数

1
解决办法

513
查看次数

标签统计

apache-spark ×1

gridsearchcv ×1

partitioning ×1

pyspark ×1

python ×1

scikit-learn ×1

在 GridSearchCV 中使用多指标评估

什么是混洗分区？

标签 统计

小编Tan_ark的帖子

标签统计