xgboost,抵消曝光?

The*_*Sun 5 r xgboost

我在R中建模索赔频率(泊松区)。我使用gbmxgboost包,但似乎xgboost没有偏移参数来考虑风险敞口?

在中gbm,应考虑以下风险:

gbm.fit(x = train,y = target, n.trees = 100,distribution = "poisson", offset = log(exposure))
Run Code Online (Sandbox Code Playgroud)

如何使用xgboost达到相同的目的?

PS:由于每次观察到索赔时都会创建新的Obs,因此我无法将风险暴露用作预测指标。

Pet*_*wth 5

创建 xgboost 矩阵后,您可以使用 setinfo 和 base_margin 属性设置偏移量,例如:

setinfo(xgtrain, "base_margin", log(d$exposure))
Run Code Online (Sandbox Code Playgroud)

您可以从我在这里提出的类似问题中看到完整的示例:XGBoost - 具有不同曝光/偏移的泊松分布


Vin*_*yen 0

按暴露量标准化您的计数,并将暴露量用作重量。有关更多详细信息,请参阅此答案。