具有大量类别的分类

fla*_*023 5 machine-learning neural-network

假设我有一个包含 1000 万张图像的训练数据集,其中包含 100,000 个不同人的图像。我想创建一个 ML 模型来识别给定图像中的人。考虑到人数众多(班级),最好的方法是什么?

小智 6

一种可能的方法是将其视为验证问题而不是多重分类。也就是说,为每个人训练一个二元分类器。您也可以参考这篇论文:https ://arxiv.org/abs/1503.03832


小智 1

尝试一些 Boosting 算法,即 LightGBM、XGBOOST 它们是为如此大的数据集而设计的。