xgboost及其sklearn的集成feature_importances_错误

Gui*_*sch 5 python scikit-learn xgboost

我正在使用XGBoostsklearn的包装.

每当我尝试打印时feature_importances_,都会出现以下错误:

ValueError:具有基数10的int()的无效文字

深入研究代码我发现该feature_importances_ 属性是从原始助推器调用get_fscore 方法(带空params).此方法显式返回如下形状的字典:

{'feat_name1':5,'feat_name2':8,...,'feat_nameN':1}
Run Code Online (Sandbox Code Playgroud)

因此,考虑到feature_importances_应用int转换到键会发现错误的消息基本原理.

keys = [int(k.replace('f', '')) for k in fs.keys()] #this is the conflictive line of code
Run Code Online (Sandbox Code Playgroud)

所以,我的问题是双重折叠的:

1- 这是一个错误,因此我应该报告它(甚至修复它并请求拉动)?

2-这个get_fscore函数及其fmap参数是否缺少?

Ale*_*exR 2

我建议将其报告为 XGBoost Github 站点上的错误: https: //github.com/dmlc/xgboost/issues