什么是最好的分类器

Question

例如，如果我们给定一个训练集，它有超过 10000 个数据点（训练集的大小），没有超过 100000 个特征，类标签接近 20。那么在这种情况下，哪个分类器（决策树、svm、Naive 等方法）贝叶斯、神经网络、增强）会给我最准确的分类测试数据的类标签。

Answer 1

正如评论中所指出的，没有一般规则。

但是，由于您有相当多的训练示例和非常多的特征，因此您可能需要某种分类器来鼓励特征稀疏性。我会先尝试带有 L1 或弹性净惩罚的 SGD 线性分类器。