我们如何将线性层的输出提供给 PyTorch 中的 Conv2D?

Jit*_*ddi 1 python autoencoder torch pytorch torchvision

我正在构建一个自动编码器,我需要将图像编码为长度为 100 的潜在表示。我的模型使用以下架构。

        self.conv1 = nn.Conv2d(in_channels = 3, out_channels = 32, kernel_size=3)
        self.conv2 = nn.Conv2d(in_channels=32,out_channels=64,kernel_size=3,stride=2)
        self.conv3 = nn.Conv2d(in_channels=64,out_channels=128,kernel_size=3,stride=2)

        self.linear = nn.Linear(in_features=128*30*30,out_features=100)

        self.conv1_transpose = nn.ConvTranspose2d(in_channels=128,out_channels=64,kernel_size=3,stride=2,output_padding=1)
        self.conv2_transpose = nn.ConvTranspose2d(in_channels=64,out_channels=32,kernel_size=3,stride=2,output_padding=1)
        self.conv3_transpose = nn.ConvTranspose2d(in_channels=32,out_channels=3,kernel_size=3,stride=1)  
Run Code Online (Sandbox Code Playgroud)

有什么方法可以将Linear图层的输出提供给一个Conv2D或一个ConvTranspose2D图层,以便我可以重建我的图像?如果我删除Linear图层,输出将恢复。我想知道如何重建我的图像保留Linear

任何帮助,将不胜感激。谢谢!

ccl*_*ccl 7

您可以使用另一个线性层:

self.linear2 = nn.Linear(in_features=100, out_features=128*30*30)
Run Code Online (Sandbox Code Playgroud)

然后将输出重塑为 3D 体积并将其传递到您的反卷积层。