我正在研究卷积神经网络.我对CNN中的某些层感到困惑.
关于ReLu ......我只知道它是无限逻辑函数的总和,但是ReLu没有连接到任何上层.为什么我们需要ReLu,它是如何工作的?
关于辍学......辍学如何运作?我听了G. Hinton的视频讲话.他说,有一种策略可以在训练权重时随机忽略一半节点,并在预测时减半.他说,它的灵感来自随机森林,与计算这些随机训练模型的几何平均值完全相同.
这种策略与辍学一样吗?
有人可以帮我解决这个问题吗?
嗨,我是Computer Vision的新手.我正在研究Dense SIFT和HOG.对于密集SIFT,算法只将每个点视为感兴趣点并计算其梯度向量.HOG是用梯度向量描述图像的另一种方式.
我认为Dense SIFT是HOG的特例.在HOG中,如果我们将bin大小设置为8,则每个窗口有4个块,每个块有4个单元格,块步长与块大小相同,我们仍然可以为此窗口获得128个暗淡的向量.我们可以设置任何窗口步幅来滑动窗口以检测整个图像.如果这两种算法的窗口步幅相同,则可以得到相同的结果.
我不确定我是否正确.谁能帮我?
嗨,我正在开发Android,我想用我的手机相机做点什么.我正在使用OpenCV-2.4.9 Java包来提取HOG功能,但我对输出向量感到困惑.
我的图片尺寸为480x640.我将窗口设置为48x64,块大小为24x32,每个单元格为12x16和8个单元格.因此,对于每个窗口,我应该获得128维数据来描述它.运行以下代码后:
MatOfFloat keyPoints = new MatOfFloat();
Hog.compute(imagePatch, keyPoints);
Run Code Online (Sandbox Code Playgroud)
keyPoints是一个长度为172800的数组(我认为它是1350x128).我认为应该有一个参数来设置窗口步幅来控制窗口的数量.在库中,还有另一个控制窗口步幅的功能:
public void compute(Mat img, MatOfFloat descriptors, Size winStride, Size padding, MatOfPoint locations)
Run Code Online (Sandbox Code Playgroud)
但我不知道参数的含义.任何人都可以帮我解决这个问题吗?