Ris*_*pta 10 python deep-learning conv-neural-network keras tensorflow
我对过滤器参数感到困惑,它是 keras 中 Conv2D() 层函数的第一个参数。据我了解,过滤器应该执行诸如边缘检测或锐化图像或模糊图像之类的操作,但是当我将模型定义为
input_shape = (32, 32, 3)
model = Sequential()
model.add( Conv2D(64, kernel_size=(5, 5), activation='relu', input_shape=input_shape, strides=(1,1), padding='same') )
model.add(MaxPooling2D(pool_size=(2, 2), strides=(2,2)))
model.add(Conv2D(64, kernel_size=(5, 5), activation='relu', input_shape=input_shape, strides=(1,1), padding='same'))
model.add(MaxPooling2D(pool_size=(2, 2), strides=(2,2)))
model.add(Conv2D(128, kernel_size=(5, 5), activation='relu', input_shape=input_shape, strides=(1,1), padding='same'))
model.add(Flatten())
model.add(Dense(3072, activation='relu'))
model.add(Dense(2048, activation='relu'))
model.add(Dense(num_classes, activation='softmax'))
Run Code Online (Sandbox Code Playgroud)
我没有在 Conv2D 函数中的任何地方提到边缘检测或模糊或锐化。输入图像是 32 x 32 RGB 图像。
所以我的问题是,当我将卷积层定义为 时Conv2D(64, ...),这 64 是否意味着 keras 随机选择的 64 个不同类型的过滤器,例如垂直边缘、水平边缘等?如果是这样,那么 32x32 1 通道图像上的卷积层(具有 64 个滤波器和 5x5 内核和 1x1 步长)的输出是 64 个图像,每个图像大小为 28x28。这 64 个图像如何组合成一个图像以用于进一步的层?
Jak*_*kub 13
该filters参数设置该层中卷积滤波器的数量。使用参数指定的方法将这些过滤器初始化为小的随机值kernel_initializer。在网络训练期间,过滤器以最小化损失的方式更新。因此,在训练过程中,过滤器将学习检测某些特征,例如边缘和纹理,它们可能会变成如下图所示(来自此处)。
认识到过滤器不是手工制作的,这一点非常重要。这些是在训练过程中自动学习的——这就是深度学习的美妙之处。
我强烈建议您浏览一些深度学习资源,特别是https://cs231n.github.io/volval-networks/和https://www.youtube.com/watch?v=r5nXYc2wYvI&list=PLypiXJdtIca5sxV7aE3-PS9fYX3vUdIOX&index=3&t=3122s。
| 归档时间: |
|
| 查看次数: |
8053 次 |
| 最近记录: |