小编dum*_*ild的帖子

class_weight = '平衡' 相当于朴素贝叶斯

我正在使用两个不同的分类器对相同的不平衡数据执行一些(二进制)文本分类。我想比较两个分类器的结果。

使用 sklearn 逻辑回归时,我可以选择设置class_weight = 'balanced'sklearn 朴素贝叶斯,但没有可用的参数。

我知道,我可以从较大的类中随机抽样,以便最终使两个类的大小相等,但随后数据就会丢失。

为什么朴素贝叶斯没有这样的参数?我猜想这与算法的性质有关,但找不到任何关于这个具体问题的信息。我也想知道相当于什么?如何实现类似的效果(分类器意识到数据不平衡,并给予少数类别更多的权重,而给予多数类别较少的权重)?

python scikit-learn logistic-regression naivebayes

6
推荐指数
1
解决办法
2994
查看次数