小编rvn*_*ita的帖子

我应该如何使用具有大量不同类别的数据来教授机器学习算法?(SVM)

我正在尝试使用看到横幅的人的点击和转换数据来教我的SVM算法.主要问题是点击率约为所有数据的0.2%,因此它的不成比例很大.当我在测试阶段使用简单的SVM时,它总是只预测"视图"类而不是"点击"或"转换".平均而言,它给出了99.8%的正确答案(因为不成比例),但如果你检查"点击"或"转换",它会给出0%的正确预测.如何调整SVM算法(或选择另一个算法)以考虑不成比例?

machine-learning svm scikit-learn supervised-learning

8
推荐指数
1
解决办法
3326
查看次数