标签: conv-neural-network

将卷积层与密集层连接时如何推断输出的形状？

我正在尝试使用构建卷积神经网络pytorch，但无法理解如何解释第一个密集连接层的输入神经元。举例来说，我有以下架构：

self.conv_layer = nn.Sequential(
   nn.Conv2d(3, 32, 5),
   nn.Conv2d(32, 64, 5),
   nn.MaxPool2d(2, 2),
   nn.Conv2d(64, 128, 5),
   nn.Conv2d(128, 128, 5),
   nn.MaxPool2d(2, 2))

self.fc_layer = nn.Sequential(
   nn.Linear(X, 512),
   nn.Linear(512, 128),
   nn.Linear(128, 10))

Run Code Online (Sandbox Code Playgroud)

这X是第一个线性层中的神经元数量。那么，我是否需要跟踪每一层输出张量的形状以便我可以弄清楚X？

现在，我可以将值放入公式中(W - F + 2P) / S + 1并计算每层之后的形状，这会有点方便。

难道没有更方便的东西可以自动执行此操作吗？

python conv-neural-network pytorch

Yas*_*mel

2021 08-25

0
推荐指数

1
解决办法

1129
查看次数

为什么创建空白矩阵会返回null而不是0.0？

我有一个Java方法fill0s(),它将一个较小的矩阵输入到一个较大的矩阵中,据说填充了0:

public class PoolingFunctions {

    // Fill needed spaces with 0
    public static Double[][] fill0s(Double[][] image, int filter_size){
        int columns_remaining = filter_size - (image[0].length%filter_size);
        int rows_remaining = filter_size - (image.length%filter_size);
        // CREATE A MATRIX: HERE LIES THE PROBLEM: //////////////////////////////
        Double [][] blank_matrix = new Double [(image.length)+columns_remaining][(image[0].length)+rows_remaining];
            for (int i = 0; i<image.length; i++) {
                for (int j = 0; j<image[i].length; j++) {
                    blank_matrix[i][j] = image[i][j];
                }
            }

        return blank_matrix;
    }
}

Run Code Online (Sandbox Code Playgroud)

并在调用此方法后:

public class MainPooling{
    public static void …

Run Code Online (Sandbox Code Playgroud)

java null matrix convolution conv-neural-network

Lar*_*rry

2017 07-14

-1
推荐指数

1
解决办法

131
查看次数

了解 CNN 和 RNN 之间的基本区别

在谈到图像/计算机视觉时，我试图了解 CNN 架构和 RCNN 架构之间的基本概念差异。

如果我错了，请纠正我，但据我所知，CNN 提供空间不变性（位置），而 RNN 提供时间不变性（时间）。

artificial-intelligence deep-learning conv-neural-network tensorflow recurrent-neural-network

Shi*_*ddy

lucky-day

-1
推荐指数

1
解决办法

1459
查看次数

著名的回归神经网络

我遇到过许多用于分类问题的神经网络架构。AlexNet、ResNet、VGGNet、GoogLeNet 等......是否有类似的回归问题网络可用于迁移学习？

artificial-intelligence neural-network conv-neural-network keras pytorch

Ris*_*hal

lucky-day

-1
推荐指数

1
解决办法

503
查看次数

将 RGB 转换为类/单个整数值

我有一个来自 RGB 图像 (64,64,3) 的 numpy 数组，我需要将每个现有的 RGB 组合转换为一个类，由整数值表示。所以最后我有一个包含整数值（0-N）的数组（64,64）。这些值代表图片中特定的 RGB 组合。当然，每种 RGB 组合只获得一个值。简而言之：每种颜色都是一个类，每个像素都有一个合适的类值 (0-N) :)

显然这不是一个大问题，我可以遍历每个像素，检查 RGB 值，如果它们不在“已发现的 RGB”临时列表中，我添加这些值并为这些 RGB 值提供代表类的整数值，否则我在 tempList 中搜索 rgb 值，并给出我在列表中记下的整数值 - 或类似的值。

但说实话，我需要对很多图像执行此操作，并且我尝试使用 python 来做得更好。所以我想知道是否有人有更有效的方法来做到这一点？我浏览了图书馆和看板，但找不到好的方法。

python arrays numpy image conv-neural-network

作者

2022 08-09

-1
推荐指数

1
解决办法

1851
查看次数