Pytorch张量的哪一部分代表通道?

Roh*_*ngh 4 python dimension conv-neural-network pytorch tensor

令人惊讶的是,环顾互联网后,我还没有找到这个问题的答案。我对3D张量特别感兴趣。通过自己的实验,我发现在创建张量时:

h=torch.randn(5,12,5)
Run Code Online (Sandbox Code Playgroud)

然后在其上放一个卷积层,定义如下:

conv=torch.nn.Conv1d(12,48,3,padding=1)
Run Code Online (Sandbox Code Playgroud)

输出是(5,48,5)张量。那么,我是否假设对于火炬中的3d张量,中间数字代表通道数,我是否正确?

编辑:似乎在运行conv2d时,输入维是张量中的第一个条目,例如,我需要将其设为4d张量(1,48,5,5)。现在我很困惑

任何帮助深表感谢!

Uma*_*pta 5

对于conv2D,输入应为(N,C,H,W)格式。N是样本数/ batch_size。C是渠道。H和W分别是高度和宽度。

请参阅https://pytorch.org/docs/stable/nn.html#torch.nn.Conv2d中的形状文档

对于conv1D,输入应为(N,C,L),请参见https://pytorch.org/docs/stable/nn.html#conv1d上的文档