LightGBM 中的 Bagging 如何工作

Kid*_*Kid 4 machine-learning xgboost lightgbm

在lightGBM模型中,有2个与bagging相关的参数

bagging_fraction
bagging_freq (frequency for bagging
              0 means disable bagging; k means perform bagging at every k 
              iteration
              Note: to enable bagging, bagging_fraction should be set to 
              value smaller than 1.0 as well)
Run Code Online (Sandbox Code Playgroud)

我可以在 gdbt 中找到关于这个装袋函数的更详细的解释。所以有没有人给我更详细的解释?

Myk*_*vyi 6

该代码执行文档中所说的 - 它对大小为 的训练示例的子集进行采样bagging_fraction * N_train_examples。并且在这个子集上执行第 i 棵树的训练。可以对每棵树(即每次迭代)或在每bagging_freq棵树都经过训练之后进行采样。

例如,bagging_fraction=0.5, bagging_freq=10意味着0.5*N_train_examples每 10 次迭代就会对新条目进行采样