分类方法中的减少类是否提高了准确性?

min*_*nks 0 machine-learning

我很想知道减少多级分类的监督分类模型(特别是Logistic回归)中的类数量是否有助于提高准确性.例如,如果我有10000个样本的50个类,我通过将某些类组合在一起将类的数量减少到30个.这会显着提高我的分类模型的准确性吗?

Gui*_*ull 6

如果您组合的类很相似并且有大量样本在它们之间错误分类,它肯定会提高您的性能,因为它会减少错误.

例如:

  • 想象一下,您正在对4种不同类别(猫,狗,椅子,桌子)的样本进行分类
  • 如果将这些类别组合在一起并执行动物与非动物分类,那么当猫被错误分类为狗(并且反之亦然)时发生的所有分类错误将不再发生,并且您的整体准确性将得到改善.

如果您分组的课程不相似,则很可能无法提高您的准确性,因为您不会减少错误的数量.想象一下,你的分类器是如此优秀,以至于你不会将任何猫误认为是狗,反之亦然,在组合这些类时你不会减少任何错误,因为没有.