如何有效地计算 PyTorch 中的批量成对距离

JoS*_*rGH 8 deep-learning pytorch tensor

我有形状的张量 X 和形状的BxNxDY BxNxD

我想计算批次中每个元素的成对距离,即我是一个BxMxN张量。

我该怎么做呢?

这里有一些关于这个话题的讨论:https : //github.com/pytorch/pytorch/issues/9406,但我不明白,因为有很多实现细节,而没有突出显示实际的解决方案。

一种天真的方法是使用此处讨论的非批量成对距离的答案:https : //discuss.pytorch.org/t/efficient-distance-matrix-computation/9065,即

import torch
import numpy as np

B = 32
N = 128
M = 256
D = 3

X = torch.from_numpy(np.random.normal(size=(B, N, D)))
Y = torch.from_numpy(np.random.normal(size=(B, M, D)))


def pairwise_distances(x, y=None):
    x_norm = (x**2).sum(1).view(-1, 1)
    if y is not None:
        y_t = torch.transpose(y, 0, 1)
        y_norm = (y**2).sum(1).view(1, -1)
    else:
        y_t = torch.transpose(x, 0, 1)
        y_norm = x_norm.view(1, -1)

    dist = x_norm + y_norm - 2.0 * torch.mm(x, y_t)
    return torch.clamp(dist, 0.0, np.inf)


out = []
for b in range(B):
    out.append(pairwise_distances(X[b], Y[b]))
print(torch.stack(out).shape)
Run Code Online (Sandbox Code Playgroud)

如何在不循环 B 的情况下执行此操作?谢谢

din*_*ino 6

我遇到了类似的问题,并花了一些时间来找到最简单、最快的解决方案。现在您可以使用 PyTorch cdist计算批量距离,这将为您提供BxMxN张量:

torch.cdist(Y, X)
Run Code Online (Sandbox Code Playgroud)

此外,如果您只想计算两个矩阵的每对行之间的距离,它也很有效。