pytorch中的多维张量点积

Ruc*_*tel 3 dot-product pytorch tensor

我有两个形状 (8, 1, 128) 的张量,如下所示。

q_s.shape
Out[161]: torch.Size([8, 1, 128])

p_s.shape
Out[162]: torch.Size([8, 1, 128])
Run Code Online (Sandbox Code Playgroud)

上面两个张量代表一批 8 个 128 维向量。q_s我想要批次与批次的点积p_s。我怎样才能做到这一点?我尝试使用torch.tensordot如下函数。它也按预期工作。但它也做了额外的工作,这是我不希望它做的。请参阅以下示例。

dt = torch.tensordot(q_s, p_s, dims=([1,2], [1,2]))

dt
Out[176]: 
tensor([[0.9051, 0.9156, 0.7834, 0.8726, 0.8581, 0.7858, 0.7881, 0.8063],
        [1.0235, 1.5533, 1.2155, 1.2048, 1.3963, 1.1310, 1.1724, 1.0639],
        [0.8762, 1.3490, 1.2923, 1.0926, 1.4703, 0.9566, 0.9658, 0.8558],
        [0.8136, 1.0611, 0.9131, 1.1636, 1.0969, 0.9443, 0.9587, 0.8521],
        [0.6104, 0.9369, 0.9576, 0.8773, 1.3042, 0.7900, 0.8378, 0.6136],
        [0.8623, 0.9678, 0.8163, 0.9727, 1.1161, 1.6464, 0.9765, 0.7441],
        [0.6911, 0.8392, 0.6931, 0.7325, 0.8239, 0.7757, 1.0456, 0.6657],
        [0.8493, 0.8174, 0.8041, 0.9013, 0.8003, 0.7451, 0.7408, 1.1771]],
       grad_fn=<AsStridedBackward>)

dt.shape
Out[177]: torch.Size([8, 8])
Run Code Online (Sandbox Code Playgroud)

正如我们所看到的,这会产生大小为 (8,8) 的张量,并且我想要的点积位于对角线上。是否有任何不同的方法来获得形状为 (8,1) 的较小所需张量,该张量仅包含上述结果中对角线上的元素。更清楚地说,对角线上的元素是我们想要作为两个批次的点积的正确所需的点积。索引 [0][0] 处的元素是 q_s[0] 和 p_s[0] 的点积。索引 [1][1] 处的元素是 q_s[1] 和 p_s[1] 的点积,依此类推。

在pytorch中是否有更好的方法来获得所需的点积?

Bla*_*ear 5

你可以直接这样做:

a = torch.rand(8, 1, 128)
b = torch.rand(8, 1, 128)

torch.sum(a * b, dim=(1, 2))
# tensor([29.6896, 30.4994, 32.9577, 30.2220, 33.9913, 35.1095, 32.3631, 30.9153])    

torch.diag(torch.tensordot(a, b, dim=([1,2], [1,2])))
# tensor([29.6896, 30.4994, 32.9577, 30.2220, 33.9913, 35.1095, 32.3631, 30.9153])
Run Code Online (Sandbox Code Playgroud)

如果你设置axis=2总和,你将得到一个形状为的张量(8, 1)