标签: conv-neural-network

将卷积层与密集层连接时如何推断输出的形状?

我正在尝试使用构建卷积神经网络pytorch,但无法理解如何解释第一个密集连接层的输入神经元。举例来说,我有以下架构:

self.conv_layer = nn.Sequential(
   nn.Conv2d(3, 32, 5),
   nn.Conv2d(32, 64, 5),
   nn.MaxPool2d(2, 2),
   nn.Conv2d(64, 128, 5),
   nn.Conv2d(128, 128, 5),
   nn.MaxPool2d(2, 2))

self.fc_layer = nn.Sequential(
   nn.Linear(X, 512),
   nn.Linear(512, 128),
   nn.Linear(128, 10))
Run Code Online (Sandbox Code Playgroud)

X是第一个线性层中的神经元数量。那么,我是否需要跟踪每一层输出张量的形状以便我可以弄清楚X

现在,我可以将值放入公式中(W - F + 2P) / S + 1并计算每层之后的形状,这会有点方便。

难道没有更方便的东西可以自动执行此操作吗?

python conv-neural-network pytorch

0
推荐指数
1
解决办法
1129
查看次数

为什么创建空白矩阵会返回null而不是0.0?

我有一个Java方法fill0s(),它将一个较小的矩阵输入到一个较大的矩阵中,据说填充了0:

public class PoolingFunctions {

    // Fill needed spaces with 0
    public static Double[][] fill0s(Double[][] image, int filter_size){
        int columns_remaining = filter_size - (image[0].length%filter_size);
        int rows_remaining = filter_size - (image.length%filter_size);
        // CREATE A MATRIX: HERE LIES THE PROBLEM: //////////////////////////////
        Double [][] blank_matrix = new Double [(image.length)+columns_remaining][(image[0].length)+rows_remaining];
            for (int i = 0; i<image.length; i++) {
                for (int j = 0; j<image[i].length; j++) {
                    blank_matrix[i][j] = image[i][j];
                }
            }

        return blank_matrix;
    }
}
Run Code Online (Sandbox Code Playgroud)

并在调用此方法后:

public class MainPooling{
    public static void …
Run Code Online (Sandbox Code Playgroud)

java null matrix convolution conv-neural-network

-1
推荐指数
1
解决办法
131
查看次数

了解 CNN 和 RNN 之间的基本区别

在谈到图像/计算机视觉时,我试图了解 CNN 架构和 RCNN 架构之间的基本概念差异。

如果我错了,请纠正我,但据我所知,CNN 提供空间不变性(位置),而 RNN 提供时间不变性(时间)。

artificial-intelligence deep-learning conv-neural-network tensorflow recurrent-neural-network

-1
推荐指数
1
解决办法
1459
查看次数

著名的回归神经网络

我遇到过许多用于分类问题的神经网络架构。AlexNet、ResNet、VGGNet、GoogLeNet 等......是否有类似的回归问题网络可用于迁移学习?

artificial-intelligence neural-network conv-neural-network keras pytorch

-1
推荐指数
1
解决办法
503
查看次数

将 RGB 转换为类/单个整数值

我有一个来自 RGB 图像 (64,64,3) 的 numpy 数组,我需要将每个现有的 RGB 组合转换为一个类,由整数值表示。所以最后我有一个包含整数值(0-N)的数组(64,64)。这些值代表图片中特定的 RGB 组合。当然,每种 RGB 组合只获得一个值。简而言之:每种颜色都是一个类,每个像素都有一个合适的类值 (0-N) :)

显然这不是一个大问题,我可以遍历每个像素,检查 RGB 值,如果它们不在“已发现的 RGB”临时列表中,我添加这些值并为这些 RGB 值提供代表类的整数值,否则我在 tempList 中搜索 rgb 值,并给出我在列表中记下的整数值 - 或类似的值。

但说实话,我需要对很多图像执行此操作,并且我尝试使用 python 来做得更好。所以我想知道是否有人有更有效的方法来做到这一点?我浏览了图书馆和看板,但找不到好的方法。

python arrays numpy image conv-neural-network

-1
推荐指数
1
解决办法
1851
查看次数

深入学习手部检测

如何使用深度学习进行手部检测.是否有任何关于使用深度学习的手部检测的文章或教程或任何相关链接.请告诉我.手检测的方法或步骤是什么

computer-vision neural-network deep-learning conv-neural-network

-3
推荐指数
1
解决办法
1436
查看次数

如何实现Caffe和CNN的对象检测

我想用Caffe框架和卷积神经网络实现对象检测,你能推荐一些论文和演示吗?
我只需要知道如何实现它.
如果您能提供源代码,那将是完美的.

computer-vision neural-network deep-learning caffe conv-neural-network

-6
推荐指数
1
解决办法
5333
查看次数