PyTorch：torch.LongTensor 类型未实现 _thnn_nll_loss_forward

Question

PyTorch：torch.LongTensor 类型未实现 _thnn_nll_loss_forward

tha*_*toz 5 python machine-learning computer-vision pytorch loss-function

当尝试使用 PyTorch 创建模型时，当我尝试实现损失函数时nll_loss，它抛出以下错误

RuntimeError: _thnn_nll_loss_forward is not implemented for type torch.LongTensor

Run Code Online (Sandbox Code Playgroud)

我创建的拟合函数是：

for epoch in tqdm_notebook(range(1, epochs+1)):
    for batch_idx, (data, targets) in enumerate(train_loader):
        optimizer.zero_grad()
        net.float()
        output = net(data)
        output_x = output.argmax(dim=2) #to convert (64,50,43) -> (64, 50)
        loss = F.nll_loss(output_x, targets)
        loss.backward()
        optimizer.step()
        if batch_idx % 100 == 0:
            print('Train epochs: {} [{}/{} ({:.0f}%)]\tLoss: {:.6f}'.format(
                epoch, batch_idx*len(data), len(ds.data),
                100.*batch_idx / len(ds), loss.item()
            ))

Run Code Online (Sandbox Code Playgroud)

其中输出和目标的形状是(64, 50)，并且 dtypes 是torch.int64两者的。

Answer 1

Sha*_*hai 8

看一下描述F.nll_loss。它期望获得的输入不是argmax预测向量（类型torch.long），而是完整的 64x50x43 预测向量（类型torch.float）。请注意，您提供的预测实际上F.nll_loss比您提供的地面实况目标具有更多的维度。

在您的情况下，只需删除 argmax：

loss = F.nll_loss(output, targets)

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，4 月前
查看次数：	6230 次
最近记录：	3 年，6 月前