Jia*_*Yue 6 python convolution neural-network deep-learning tensorflow
我对 conv2d 和 conv3d 函数之间的区别有点困惑。\n例如,如果我有一堆 N 个图像,高高宽宽,有 3 个 RGB 通道。网络的输入可以是两种形式\nform1: (batch_size, N, H, W, 3) 这是一个 5 阶张量\nform2: (batch_size, H, W, 3N ) 这是一个 4 阶张量
\n\n问题是\xef\xbc\x8c 如果我将具有大小为 (N,3,3) 的 M 滤波器的 conv3d 应用到 form1 并应用具有大小为 (3,3) 的 M 滤波器的 conv2d
\n\n它们的功能操作基本相同吗?我认为这两种形式在时间和空间维度上交织在一起。
\n\n如果有人能帮助我解决这个问题,我真的很感激。
\n如果你有一堆图像,你就有一个视频。您不能有两个输入表单。您有图像或视频。对于视频情况,您可以使用 3D 卷积,但未为其定义 2D 卷积。如果您按照您提到的方式堆叠通道(3N),则 2D 卷积会将堆栈解释为具有大量通道的一张图像,而不是堆栈。
请注意,使用 (batch, H, W, Channels) 的 2D 卷积与使用 (batch, H, W, Channels, 1) 的 3D 卷积相同。