0 classification machine-learning
例如,如果我们给定一个训练集,它有超过 10000 个数据点(训练集的大小),没有超过 100000 个特征,类标签接近 20。那么在这种情况下,哪个分类器(决策树、svm、Naive 等方法)贝叶斯、神经网络、增强)会给我最准确的分类测试数据的类标签。
正如评论中所指出的,没有一般规则。
但是,由于您有相当多的训练示例和非常多的特征,因此您可能需要某种分类器来鼓励特征稀疏性。我会先尝试带有 L1 或弹性净惩罚的 SGD 线性分类器。
另请参阅Andreas Mueller 的算法流程图以尝试:

| 归档时间: |
|
| 查看次数: |
1046 次 |
| 最近记录: |