sklearn单变量特征选择

Mun*_*ong 3 python machine-learning scikit-learn

我正在尝试使用sklearn单变量功能选择来过滤掉不相关的功能:

ufs = feature_selection.SelectPercentile(feature_selection.f_classif, percentile = 60)
X_default_cvtrain = ufs.fit_transform( X_cvtrain, Y_cvtrain )
Run Code Online (Sandbox Code Playgroud)

但是,我得到了这个警告:

UserWarning: Duplicate scores. Result may depend on feature ordering.
             There are probably duplicate features, or you used a classification score for a regression task.
warn("Duplicate scores. Result may depend on feature ordering."
Run Code Online (Sandbox Code Playgroud)

这是什么意思?这里发生了什么?

谢谢.

And*_*ler 5

这意味着有重复的分数,因此所选的功能取决于功能排序.可能的原因是您有重复的功能.

  • 一些咖啡后不那么自命不凡:这意味着存在重复的相关性(F)分数,因此选择哪些特征取决于数组中特征的排序.可能的原因是几个特征是相同的. (2认同)