AlK*_*AlK 4 python decision-tree scikit-learn
我正在运行SciKit Learn中的决策树算法,我希望获得Feature_importance向量以及功能名称,以便我可以确定哪些功能在标记过程中占主导地位.你可以帮帮我吗?谢谢.
假设您将样本作为以下行的行pandas.DataFrame:
from pandas import DataFrame
features = DataFrame({'f1': (1, 2, 2, 2), 'f2': (1, 1, 1, 1), 'f3': (3, 3, 1, 1)})
labels = ('a', 'a', 'b', 'b')
Run Code Online (Sandbox Code Playgroud)
然后使用树或森林分类器:
from sklearn.tree import DecisionTreeClassifier
classifier = DecisionTreeClassifier()
classifier.fit(features, labels)
Run Code Online (Sandbox Code Playgroud)
然后,重要性应与框架列匹配:
for name, importance in zip(features.columns, classifier.feature_importances_):
print(name, importance)
# f1 0.0
# f2 0.0
# f3 1.0
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
3895 次 |
| 最近记录: |