nik*_*ilk 5 math trigonometry distance
两个对象是否可以具有相同的余弦和Tanimoto系数距离测度,其中
Tanimoto distance measure, d(x,y) = x.y / (|x|*|x|) + (|y|*|y|)- x*y
Run Code Online (Sandbox Code Playgroud)
和
cosine measure, d(x,y) = x.y /(|x|* |x|) * (|y| *|y|)
Run Code Online (Sandbox Code Playgroud)
Tanimoto 相似系数(不是真正的距离度量)定义为
d(x,y) = x.y / ((|x|*|x|) + (|y|*|y|)- x.y)
Run Code Online (Sandbox Code Playgroud)
对于位向量 x 和 y。
现在将其与余弦相似系数进行比较,
d(x,y) = x.y / (|x| * |y|)
Run Code Online (Sandbox Code Playgroud)
分母因x.y项而异。如果x.y为零,Tanimoto 和余弦相似系数将相同。
在几何上,x.y当且仅当x和y垂直时为零。
由于x和y是位向量(即其每个维度的值只能是 0 或 1),因此x.y等于零意味着
x1*y1 + x2*y2 + ... + xn*yn = 0
Run Code Online (Sandbox Code Playgroud)
如果 xi*yi = 1*1 = 1,则总和将为正。为了使总和为零,没有项xi*yi 可以等于 1。它们必须都等于 0:
所以
x1*y1 = 0
x2*y2 = 0
...
xn*yn = 0
Run Code Online (Sandbox Code Playgroud)
换句话说,如果 xi 为 1,则 yi 必须为 0,反之亦然。
所以有很多例子,谷本相似度等于余弦相似度:
x = (0,1,0,1)
y = (1,0,0,0)
Run Code Online (Sandbox Code Playgroud)
例如。