我想在我的网络中使用二维卷积层,并作为输入我想给它图片。所以我有一批图片,这意味着 ndim=3 矩阵,例如:
我输入的维度:
[10, 6, 7]
Run Code Online (Sandbox Code Playgroud)
该10值是 ,batch size另外两个值是图像大小。那么 2d 层需要的第四维是多少?
这是有趣的代码行:
[10, 6, 7]
Run Code Online (Sandbox Code Playgroud)
这是我得到的错误:
Input 0 of layer conv2d_1 is incompatible with the layer: expected ndim=4, found ndim=3. Full shape received: [None, 6, 7]*
Run Code Online (Sandbox Code Playgroud) 我正在使用带有 keras 的 yolo v3 模型,这个网络给我作为输出容器,形状如下:
[(1, 13, 13, 255), (1, 26, 26, 255), (1, 52, 52, 255)]
Run Code Online (Sandbox Code Playgroud)
所以我找到了这个链接
然后我理解了 3 个容器中的每一个的值 255,我也理解有 3 个容器,因为边界框创建有 3 种不同的图像缩放。
但我不明白为什么在输出向量中,第一个缩放率有 13 * 13 个列表,第二个有 26 * 26 个列表,最后一个有 52 * 52 个列表。
我无法找到一些很好的解释,所以我不能使用这个网络。如果有人知道我在哪里可以找到有关输出维度的一些信息,我会非常感激。
编辑
是因为如果我将图像切成 13 x 13 个部分,考虑到每个部分都是对象的中心,我只能检测 13*13 个对象吗?