我在R中建模索赔频率(泊松区)。我使用gbm和xgboost包,但似乎xgboost没有偏移参数来考虑风险敞口?
在中gbm,应考虑以下风险:
gbm.fit(x = train,y = target, n.trees = 100,distribution = "poisson", offset = log(exposure))
Run Code Online (Sandbox Code Playgroud)
如何使用xgboost达到相同的目的?
PS:由于每次观察到索赔时都会创建新的Obs,因此我无法将风险暴露用作预测指标。
创建 xgboost 矩阵后,您可以使用 setinfo 和 base_margin 属性设置偏移量,例如:
setinfo(xgtrain, "base_margin", log(d$exposure))
Run Code Online (Sandbox Code Playgroud)
您可以从我在这里提出的类似问题中看到完整的示例:XGBoost - 具有不同曝光/偏移的泊松分布
| 归档时间: |
|
| 查看次数: |
3353 次 |
| 最近记录: |