L X*_*dor 5 classification scikit-learn xgboost sklearn-pandas
我通常使用以下方法来表达特征重要性
regr = XGBClassifier()
regr.fit(X, y)
regr.feature_importances_
Run Code Online (Sandbox Code Playgroud)
其中 type(regr) 是 。
但是,我有一个腌制的 mXGBoost 模型,解压后返回一个类型的对象。这与我运行 regr.get_booster() 的对象相同。
我找到了一些从助推器对象获取可变重要性的解决方案,但是有没有办法从助推器对象获取分类器对象,以便我可以应用相同的 feature_importances_ 命令?这似乎是最直接的解决方案,或者似乎我必须编写一个模仿 feature_importances_ 输出的函数,以便它适合我记录的特征重要性......
所以理想情况下我会有类似的东西
xbg_booster = pickle.load(open("xgboost-model", "rb"))
assert str(type(xgb_booster)) == "<class 'xgboost.core.Booster'>", 'wrong class'
xgb_classifier = xgb_booster.get_classifier()
xgb_classifier.feature_importances_
Run Code Online (Sandbox Code Playgroud)
在查找分类器方面,使用增强对象可以完成的操作是否有任何限制?我想有一些保存/加载/转储的组合可以让我得到我需要的东西,但我现在陷入困境......
另外,就上下文而言,pickled 模型是 AWS sagemaker 的输出,因此我只是将其解压以进行进一步的评估
小智 3
根据我自己尝试从 SageMaker 生成的增强器对象重新创建分类器的经验,我了解到以下内容:
\n\n然而你可以做一些疯狂的事情:
\n\n您可以创建一个分类器对象,然后覆盖其中的助推器:
\n\nxgb_classifier = xgb.XGBClassifier(**xgboost_params)
\n\n[..]
\n\nxgb_classifier._Boster = 增强器
除非您安装它,否则它几乎没有任何功能数据。(我没有完全通过这个场景来验证拟合是否会提供功能所需的特征数据。)
\n\n推荐
\n\n如果您\xe2\x80\x99 不卡在使用 SageMaker 训练解决方案,您当然可以直接使用 XGBoost 进行训练。此时,您可以访问转储/保存数据以在不同上下文中使用所需的一切。
\n\n我知道您追求功能重要性,所以我希望这能让您更接近,我有一个不同的用例,并最终能够利用助推器来满足我的需要。
\n| 归档时间: |
|
| 查看次数: |
5818 次 |
| 最近记录: |