如何获取随机森林分类器中“predict”预测的类的“predict_proba”？

Question

如何获取随机森林分类器中“predict”预测的类的“predict_proba”？

Sno*_*now 6 python machine-learning random-forest scikit-learn

from sklearn import ensemble

model = ensemble.RandomForestClassifier(n_estimators=10)
model.fit(x,y)
predictions = model.predict(new)

Run Code Online (Sandbox Code Playgroud)

我知道predict()通过predict_proba()计算森林中树木的预测类概率的平均值来获得预测。

predict_proba()我想获得该方法预测的类的结果predict()。

我正在做的是：首先predict()像上面的代码一样调用，对于概率，我从树中提取最大概率，如下所示：

all_probabilities = model.predict_proba()
class_probabilities = np.array([])
for tree in all_probabilities:
    class_probabilites = np.append(class_probabilities, tree.max())

Run Code Online (Sandbox Code Playgroud)

它是否正确？如果不是，我如何提取预测类别的概率？

Answer 1

Arn*_*rne 10

该predict_proba()方法返回一个二维数组，包含每个实例和每个类的估计概率：

import numpy as np
from sklearn.ensemble import RandomForestClassifier

X = np.array([[1, 2, 3], 
              [4, 5, 6], 
              [7, 8, 9], 
              [10, 11, 12]])
y = np.array([0, 0, 1, 1])

model = RandomForestClassifier()
model.fit(X, y)

model.predict_proba(X)

Run Code Online (Sandbox Code Playgroud)

array([[0.91, 0.09],
       [0.91, 0.09],
       [0.25, 0.75],
       [0.05, 0.95]])

Run Code Online (Sandbox Code Playgroud)

正如您所注意到的，对于每个实例，预测的类别都是具有最大概率的类别。因此，获得预测类别的估计概率的一种简单方法是使用np.max()：

np.max(model.predict_proba(X), axis=1)

Run Code Online (Sandbox Code Playgroud)

array([0.91, 0.91, 0.75, 0.95])

Run Code Online (Sandbox Code Playgroud)

归档时间：	5 年前
查看次数：	16261 次
最近记录：	5 年前