具有 3d 输入的 Pytorch 交叉熵损失

Question

具有 3d 输入的 Pytorch 交叉熵损失

Har*_*nan 2 python neural-network cross-entropy pytorch

我有一个输出大小为 3D 张量的网络(batch_size, max_len, num_classes)。我的基本真理是形状(batch_size, max_len)。如果我对标签执行 one-hot 编码，它将是形状，(batch_size, max_len, num_classes)即中的值max_len是范围内的整数[0, num_classes]。由于原始代码太长，我写了一个更简单的版本，重现了原始错误。

criterion = nn.CrossEntropyLoss()
batch_size = 32
max_len = 350
num_classes = 1000
pred = torch.randn([batch_size, max_len, num_classes])
label = torch.randint(0, num_classes,[batch_size, max_len])
pred = nn.Softmax(dim = 2)(pred)
criterion(pred, label)

Run Code Online (Sandbox Code Playgroud)

pred 和 label 的形状分别是，torch.Size([32, 350, 1000])和torch.Size([32, 350])

遇到的错误是

ValueError: Expected target size (32, 1000), got torch.Size([32, 350, 1000])

Run Code Online (Sandbox Code Playgroud)

如果我对标签进行单热编码以计算损失

x = nn.functional.one_hot(label)
criterion(pred, x)

Run Code Online (Sandbox Code Playgroud)

它会抛出以下错误

ValueError: Expected target size (32, 1000), got torch.Size([32, 350, 1000])

Run Code Online (Sandbox Code Playgroud)

Answer 1

Kev*_*vin 5

从Pytorch 文档中，CrossEntropyLoss期望其输入的形状为(N, C, ...)，因此第二个维度始终是类的数量。如果您重塑preds为 size ，您的代码应该可以工作(batch_size, num_classes, max_len)。

归档时间：	5 年，4 月前
查看次数：	916 次
最近记录：	4 年，5 月前