当步幅大于 1 时，SAME 填充如何在卷积神经网络中工作？

Question

当步幅大于 1 时，SAME 填充如何在卷积神经网络中工作？

ATH*_*AGI 5 python conv-neural-network keras tensorflow zero-padding

我正在尝试在 python 中实现二维卷积。我有一个尺寸为 (m, 64, 64, 3) 的输入图像集，其中 m 是图像数量。我想对高度和宽度使用过滤器大小 f=8 和 stride=8，并使用相同的填充，以便保留输入宽度和高度 (64, 64)。

使用公式[n' = Floor((n-f+2*pad)/stride + 1)]并输入 n'=64, n=64, stride=8, f=8，我得到pad=224，其中太大了。

例如，当我将图像数量 m 设置为 1080 时，可能会导致内存错误，导致我的系统崩溃。

但是当我使用 Keras 库和以下代码时，它工作得很好。

X = keras.layers.Conv2D(filters=32, kernel_size=(8, 8), strides=(8, 8), padding='same')(X)

Run Code Online (Sandbox Code Playgroud)

这是我在 python 中实现的 Conv2D：

import numpy as np

# A.shape = (1080, 64, 64, 3)
# W.shape = (8, 8, 3, 32)
# b.shape = (32,)

def conv_fwd(A, W, b, pad=0, stride=1):
    pad_A = np.pad(A, ((0, 0), (pad, pad), (pad, pad), (0, 0)), mode='constant')
    (m, w, h, nc) = A.shape
    (fw, fh, ncc, ncn) = W.shape

    if nc != ncc:
        raise Exception('Number of channels in kernel and input do not match')

    wn = int((w-fw+2*pad)/stride + 1)
    hn = int((h-fh+2*pad)/stride + 1)
    A_n = np.zeros((m, wn, hn, ncn))
    W = W.reshape(fw*fh*ncc, ncn)

    for i in range(wn):
        for j in range(hn):
            A_n[:, i, j] = pad_A[:, i*stride:i*stride+fw, j*stride:j*stride+fh].reshape(m, fw*fh*nc).dot(W) + b
    return A_n

Run Code Online (Sandbox Code Playgroud)

所以我假设有一个不同的过程来计算 keras 中的填充。我尝试寻找源代码，但找不到。它是如何工作的？

Answer 1

小智 1

在公式中，n' = floor((n-f+2*pad)/stride + 1您采用了n' == n == 64.

这是不正确的。n' is equal to n仅当Stride is equal to 1但此处的值Stride大于 1 ( 8) 时。

这就是您获得非常高价值的原因Padding。

现在，由于您的目标是找到的值Padding，我有一个解决方案/解决方法（可能不是很优化）。

最初，使用构建模型Padding = Same，如下所示：

import tensorflow as tf
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Conv2D(filters = 64, strides = (2,2), kernel_size = (3,3), 
input_shape = (64,64,3), padding = 'same'))
print(model.summary())

Run Code Online (Sandbox Code Playgroud)

模型摘要Padding = Same如下所示：

Model: "sequential_12"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_25 (Conv2D)           (None, 32, 32, 64)        1792      
=================================================================
Total params: 1,792
Trainable params: 1,792
Non-trainable params: 0

Run Code Online (Sandbox Code Playgroud)

如果我们观察Shape的Image，它会从减少(64,64)到(32,32)即使Padding == Same。

现在，使用构建模型Padding = Valid，如下所示：

import tensorflow as tf
model = tf.keras.models.Sequential()
model.add(tf.keras.layers.Conv2D(filters = 64, strides = (2,2), kernel_size = (3,3), 
input_shape = (64,64,3), padding = 'valid'))
print(model.summary())

Run Code Online (Sandbox Code Playgroud)

上述模型的总结如下：

Model: "sequential_11"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
=================================================================
conv2d_24 (Conv2D)           (None, 31, 31, 64)        1792      
=================================================================
Total params: 1,792
Trainable params: 1,792
Non-trainable params: 0

Run Code Online (Sandbox Code Playgroud)

如果我们观察，Shape的Convolutional Layer是(None,31,31,64)。

现在，Padding可以通过公式求得，

Height with SAME Padding - Height with VALID Padding

Run Code Online (Sandbox Code Playgroud)

或者

Width with SAME Padding - Width with VALID Padding

Run Code Online (Sandbox Code Playgroud)

IE，32 - 31 = 1。

在你的情况下，填充Input Shape= (64, 64,3), Filter Size = 8,Strides = 8是1即，

Input用1 行和 1 列零填充。

归档时间：	5 年，6 月前
查看次数：	2808 次
最近记录：	5 年，6 月前