谷本系数距离测度

nik*_*ilk 5 math trigonometry distance

两个对象是否可以具有相同的余弦和Tanimoto系数距离测度,其中

Tanimoto distance measure, d(x,y) = x.y / (|x|*|x|) + (|y|*|y|)- x*y
Run Code Online (Sandbox Code Playgroud)

cosine measure, d(x,y) = x.y /(|x|* |x|) * (|y| *|y|)
Run Code Online (Sandbox Code Playgroud)

unu*_*tbu 5

Tanimoto 相似系数不是真正的距离度量)定义为

d(x,y) = x.y / ((|x|*|x|) + (|y|*|y|)- x.y)
Run Code Online (Sandbox Code Playgroud)

对于位向量 x 和 y。

现在将其与余弦相似系数进行比较,

 d(x,y) = x.y / (|x| * |y|)
Run Code Online (Sandbox Code Playgroud)

分母因x.y项而异。如果x.y为零,Tanimoto 和余弦相似系数将相同。

在几何上,x.y当且仅当xy垂直时为零。

由于xy是位向量(即其每个维度的值只能是 0 或 1),因此x.y等于零意味着

x1*y1 + x2*y2 + ... + xn*yn = 0
Run Code Online (Sandbox Code Playgroud)

如果 xi*yi = 1*1 = 1,则总和将为正。为了使总和为零,没有项xi*yi 可以等于 1。它们必须都等于 0:

所以

x1*y1 = 0
x2*y2 = 0
...
xn*yn = 0
Run Code Online (Sandbox Code Playgroud)

换句话说,如果 xi 为 1,则 yi 必须为 0,反之亦然。

所以有很多例子,谷本相似度等于余弦相似度:

x = (0,1,0,1)
y = (1,0,0,0)
Run Code Online (Sandbox Code Playgroud)

例如。