SHAP 值似乎是相加的,例如整体特征重要性图只是将每个特征的绝对 SHAP 值相加并进行比较。这使我们能够使用 SHAP 来衡量全局重要性和局部重要性。我们还可以以相同的方式获得数据记录的特定子集的特征重要性。
出于同样的原因,获取变量集的聚合 SHAP 值是否有效?例如,将“身高”、“体重”和“眼睛颜色”放入“人体描述”中,或将“温度”、“湿度”和“气压”放入“天气”中,并相应地对它们进行排名。
从理论上讲,我不明白为什么不这样做,但如果出现任何问题,我将不胜感激。
python shap
python ×1
shap ×1