PyTorch ValueError：目标大小 (torch.Size([64])) 必须与输入大小 (torch.Size([15])) 相同

Question

PyTorch ValueError：目标大小 (torch.Size([64])) 必须与输入大小 (torch.Size([15])) 相同

Nak*_*hya 5 python nlp conv-neural-network pytorch

我目前正在使用这个存储库来执行 NLP 并使用我自己的数据集了解有关 CNN 的更多信息，但我不断遇到有关形状不匹配的错误：

ValueError: Target size (torch.Size([64])) must be the same as input size (torch.Size([15]))

     10 }
     11 for epoch in tqdm(range(params['epochs'])):
---> 12     train_loss, train_acc = train(model, train_iterator, optimizer, criterion)
     13     valid_loss, valid_acc = evaluate(model, valid_iterator, criterion)
     14     epoch_mins, epoch_secs = epoch_time(start_time, end_time)

     57         print("PredictionShapeAfter:")
     58         print(predictions.shape)
---> 59         loss = criterion(predictions, batch.l)
     60 
     61         acc = binary_accuracy(predictions, batch.l)

Run Code Online (Sandbox Code Playgroud)

经过一番挖掘，我发现我的 CNN 预测与其所比较的训练数据事实大小不同：

  Input Shape:
    torch.Size([15, 64])
    Truth Shape:
    torch.Size([64])
    embedded unsqueezed: torch.Size([15, 1, 64, 100])
    cat shape: torch.Size([15, 300])
    Prediction Shape Before Squeeze:
    torch.Size([15, 1])
    PredictionShapeAfter:
    torch.Size([15])

Run Code Online (Sandbox Code Playgroud)

该模型将预测形状（此列表中的最后一个值）作为输入的第一个维度。这是一个常见问题吗？有办法解决这个问题吗？

我的型号：

class CNN(nn.Module):
    def __init__(self, vocab_size, embedding_dim, n_filters, filter_sizes, output_dim, 
                 dropout, pad_idx):
        super().__init__()
                
        self.embedding = nn.Embedding(vocab_size, embedding_dim, padding_idx = pad_idx)
        
        self.convs = nn.ModuleList([
                                    nn.Conv2d(in_channels = 1, 
                                              out_channels = n_filters, 
                                              kernel_size = (fs, embedding_dim)) 
                                    for fs in filter_sizes
                                    ])
        
        self.fc = nn.Linear(len(filter_sizes) * n_filters, output_dim)
        
        self.dropout = nn.Dropout(dropout)
        
    def forward(self, text): 
        embedded = self.embedding(text)
        embedded = embedded.unsqueeze(1)
        print(f"embedded unsqueezed: {embedded.shape}")
        conved = [F.relu(conv(embedded)).squeeze(3) for conv in self.convs]          
        pooled = [F.max_pool1d(conv, conv.shape[2]).squeeze(2) for conv in conved]
        cat = self.dropout(torch.cat(pooled, dim = 1))   
        print(f"cat shape: {cat.shape}")       
        return self.fc(cat)

Run Code Online (Sandbox Code Playgroud)

我的训练功能：

def train(model, iterator, optimizer, criterion):
    
    epoch_loss = 0
    epoch_acc = 0
    
    model.train()
    
    for batch in iterator:
        
        optimizer.zero_grad()

        print("InputShape:")
        print(batch.t.shape)
        print("Truth Shape:")
        print(batch.l.shape)

        predictions = model(batch.t)
        print("Prediction Shape Before Squeeze:")
        print(predictions.shape)

        predictions = predictions.squeeze(1)
        print("PredictionShapeAfter:")
        print(predictions.shape)
        loss = criterion(predictions, batch.l)
        
        acc = binary_accuracy(predictions, batch.l)
        
        loss.backward()
        
        optimizer.step()
        
        epoch_loss += loss.item()
        epoch_acc += acc.item()
        
    return epoch_loss / len(iterator), epoch_acc / len(iterator)

Run Code Online (Sandbox Code Playgroud)

我的完整代码可以在此链接中找到。

Answer 1

uke*_*emi 2

你的问题在这里：

self.convs = nn.ModuleList([
                            nn.Conv2d(in_channels = 1, 
                                      out_channels = n_filters, 
                                      kernel_size = (fs, embedding_dim)) 
                            for fs in filter_sizes
                            ])

Run Code Online (Sandbox Code Playgroud)

您正在输入形状的数据[15, 1, 64, 100]，卷积将其解释为大小为 15 的批次，HxW 64x100 的 1 通道图像。

看起来您想要的是一批大小为 64 的批次，因此首先交换这些尺寸：

...
embedded = embedded.swapdims(0,2)
conved = [F.relu(conv(embedded)).squeeze(3) for conv in self.convs] 
...

Run Code Online (Sandbox Code Playgroud)

@NakulUpadhya，您的填充图像的尺寸已减小，因此对于下一个卷积滤波器来说它现在太小了。发生这种情况是因为您的图像显然只有 15 像素高。 (2认同)

归档时间：	4 年，11 月前
查看次数：	1511 次
最近记录：	4 年，11 月前