什么是最好的分类器

0 classification machine-learning

例如,如果我们给定一个训练集,它有超过 10000 个数据点(训练集的大小),没有超过 100000 个特征,类标签接近 20。那么在这种情况下,哪个分类器(决策树、svm、Naive 等方法)贝叶斯、神经网络、增强)会给我最准确的分类测试数据的类标签。

Dou*_*gal 5

正如评论中所指出的,没有一般规则。

但是,由于您有相当多的训练示例和非常多的特征,因此您可能需要某种分类器来鼓励特征稀疏性。我会先尝试带有 L1 或弹性净惩罚的 SGD 线性分类器。

另请参阅Andreas Mueller 的算法流程图以尝试