相关疑难解决方法(0)

sklearn 如何在精确召回曲线中选择阈值步骤?

我在示例乳腺癌数据集上训练了一个基本的 FFNN。对于结果,该precision_recall_curve函数提供了 416 个不同阈值的数据点。我的数据包含 569 个独特的预测值,据我了解 Precision Recall Curve 我可以应用 568 个不同的阈值并检查结果 Precision 和 Recall。

但是我该怎么做呢?有没有办法设置要测试的阈值数量sklearn?或者至少解释一下如何sklearn选择这些阈值?

我的意思是 417 应该足够了,即使对于更大的数据集,我只是好奇它们是如何被选中的。

# necessary packages
from sklearn.datasets import load_breast_cancer
import pandas as pd
import numpy as np
from keras.models import Sequential
from keras.layers import Dense
from keras.layers import Dropout

# load data
sk_data = load_breast_cancer(return_X_y=False)

# safe data in pandas
data = sk_data['data']
target = sk_data['target']
target_names = sk_data['target_names']
feature_names = sk_data['feature_names']
data = pd.DataFrame(data=data, columns=feature_names)

# …
Run Code Online (Sandbox Code Playgroud)

python precision scikit-learn precision-recall

12
推荐指数
1
解决办法
2197
查看次数