我正在尝试构建一个应用程序来检测来自网页的广告图像.一旦我发现了那些,我就不会允许那些在客户端显示.
从我对Stackoverflow问题的帮助,我认为SVM是达到我目标的最佳方法.
所以,我自己编写了SVM和SMO.我从UCI数据存储库获得的数据集有3280个实例(链接到数据集),其中大约400个来自表示广告图像的类,其余表示非广告图像.
现在我正在使用前2800个输入集并训练SVM.但在查看准确率后,我意识到这2800个输入集中的大多数来自非广告图像类.因此,我对该课程的准确性非常高.
那我该怎么办?关于我要给SVM培训多少输入集,以及每个类有多少输入集?
谢谢.干杯.(基本上提出了一个新问题,因为上下文与我之前的问题不同.优化神经网络输入数据)
谢谢回复.我想检查一下我是否正确得出广告和非广告类的C值.请给我反馈.

或者你可以在这里看到doc版本.
你可以在这里看到y1 eqaul到y2的图形

并且y1在这里不等于y2
