使用熵的加权决策树

Jac*_*cob 8 machine-learning entropy decision-tree

我正在使用互信息增益作为分裂函数构建二进制分类树.但由于训练数据偏向于几个类,因此建议通过反类频率对每个训练示例进行加权.

如何加权训练数据?在计算估算熵的概率时,我是否采用加权平均值?

编辑:我想用权重表示熵.