小编Amo*_*shi的帖子

SVM分类 - 每个类的最小输入集数

我正在尝试构建一个应用程序来检测来自网页的广告图像.一旦我发现了那些,我就不会允许那些在客户端显示.

从我对Stackoverflow问题的帮助,我认为SVM是达到我目标的最佳方法.

所以,我自己编写了SVM和SMO.我从UCI数据存储库获得的数据集有3280个实例(链接到数据集),其中大约400个来自表示广告图像的类,其余表示非广告图像.

现在我正在使用前2800个输入集并训练SVM.但在查看准确率后,我意识到这2800个输入集中的大多数来自非广告图像类.因此,我对该课程的准确性非常高.

那我该怎么办?关于我要给SVM培训多少输入集,以及每个类有多少输入集?

谢谢.干杯.(基本上提出了一个新问题,因为上下文与我之前的问题不同.优化神经网络输入数据)


谢谢回复.我想检查一下我是否正确得出广告和非广告类的C值.请给我反馈.

在此输入图像描述

或者你可以在这里看到doc版本.

你可以在这里看到y1 eqaul到y2的图形 在此输入图像描述

并且y1在这里不等于y2 在此输入图像描述

classification machine-learning svm training-data

4
推荐指数
1
解决办法
8742
查看次数

SVM序列最小优化收敛性问题

我已经在支持向量机上工作了大约2个月了.我自己编写了SVM编码,对于SVM的优化问题,我使用了John Platt博士的Sequential Minimal Optimization(SMO).

现在我正处于我要进行网格搜索以找到我的数据集的最佳C值的阶段.(请在此处查找我的项目应用程序和数据集详细信息的详细信息SVM分类 - 每个类的最小输入集数量)

我已经成功检查了我自定义实现的SVM的精度,C值范围从2 ^ 0到2 ^ 6.但是现在我遇到了关于C> 128的SMO收敛的一些问题.就像我试图找到C = 128的alpha值一样,它在实际收敛并成功给出alpha值之前需要很长时间.

对于C = 100,SMO收敛所花费的时间约为5小时.这个巨大的我认为(因为SMO应该很快.)虽然我的准确度很高?我被搞砸了,因为我不能测试更高C值的准确性.

我实际上显示了SMO每次传递中更改的alpha数,并且让10,13,8 ... alphas不断变化.KKT条件确保收敛,所以这里发生了什么奇怪的事情?

请注意,虽然执行时间很长,但我的实现在C <= 100时工作正常且准确性很高.

请给我关于这个问题的意见.

谢谢你和干杯.

smo classification machine-learning convex-optimization svm

2
推荐指数
1
解决办法
1876
查看次数

神经网络输入数据的优化

我正在尝试构建一个应用程序来检测来自网页的广告图像.一旦我发现了那些,我就不会允许那些在客户端显示.

基本上我使用反向传播算法来训练神经网络使用这里给出的数据集:http://archive.ics.uci.edu/ml/datasets/Internet+Advertisements.

但是在那个数据集中没有.属性非常高.事实上,该项目的一位导师告诉我,如果你训练具有许多属性的神经网络,那么需要花费大量的时间来接受训练.那么有没有办法优化输入数据集?或者我只需要使用那么多属性?

inputstream mathematical-optimization neural-network

1
推荐指数
1
解决办法
1967
查看次数