XGBoost 从增强器对象中获取分类器对象？

Question

XGBoost 从增强器对象中获取分类器对象？

L X*_*dor 5 classification scikit-learn xgboost sklearn-pandas

我通常使用以下方法来表达特征重要性

regr = XGBClassifier()
regr.fit(X, y)
regr.feature_importances_

Run Code Online (Sandbox Code Playgroud)

其中 type(regr) 是。

但是，我有一个腌制的 mXGBoost 模型，解压后返回一个类型的对象。这与我运行 regr.get_booster() 的对象相同。

我找到了一些从助推器对象获取可变重要性的解决方案，但是有没有办法从助推器对象获取分类器对象，以便我可以应用相同的 feature_importances_ 命令？这似乎是最直接的解决方案，或者似乎我必须编写一个模仿 feature_importances_ 输出的函数，以便它适合我记录的特征重要性......

所以理想情况下我会有类似的东西

xbg_booster = pickle.load(open("xgboost-model", "rb"))
assert str(type(xgb_booster)) == "<class 'xgboost.core.Booster'>", 'wrong class'
xgb_classifier = xgb_booster.get_classifier()
xgb_classifier.feature_importances_

Run Code Online (Sandbox Code Playgroud)

在查找分类器方面，使用增强对象可以完成的操作是否有任何限制？我想有一些保存/加载/转储的组合可以让我得到我需要的东西，但我现在陷入困境......

另外，就上下文而言，pickled 模型是 AWS sagemaker 的输出，因此我只是将其解压以进行进一步的评估

Answer 1

小智 3

根据我自己尝试从 SageMaker 生成的增强器对象重新创建分类器的经验，我了解到以下内容：

\n\n

似乎不可能从增强器重新创建分类器。:(
https://xgboost.readthedocs.io/en/latest/python/python_api.html#xgboost.Booster提供了有关 booster 类的详细信息，以便您可以查看它的功能。

\n\n

然而你可以做一些疯狂的事情：

\n\n

您可以创建一个分类器对象，然后覆盖其中的助推器：
\n\n
xgb_classifier = xgb.XGBClassifier(**xgboost_params)
\n\n
[..]
\n\n
xgb_classifier._Boster = 增强器

\n\n

除非您安装它，否则它几乎没有任何功能数据。（我没有完全通过这个场景来验证拟合是否会提供功能所需的特征数据。）

\n\n

您可以从分类器中删除 booster 对象，然后直接使用 xgboost 对分类器进行 pickle。然后稍后将 SageMaker 助推器恢复到其中。这种令人厌恶的东西更接近并且似乎有效，但并不是真正仅来自 SageMaker 输出的再水化分类器对象。

\n\n

归档时间：	6 年，6 月前
查看次数：	5818 次
最近记录：	3 年，9 月前