Ogn*_*jen 6 algorithm vector machine-learning similarity data-mining
如果我们有一组M个单词,并且事先知道每对单词的含义的相似性(具有相似性的M×M矩阵),我们可以使用哪个算法为每个单词制作一个k维位向量,这样只需通过比较它们的向量来比较每对单词(例如得到向量的绝对差异)?
我不知道这个特殊问题是如何被调用的.如果我知道,在一堆具有相似描述的算法中找到它们会更容易.
补充观察:
我认为这个算法必须产生一个,在这种情况下需要,副作用.如果从矩阵中,单词A类似于单词B而B类似于C,但是检测到低[A,C]相似性,则计算结果向量差异也应该产生高[A,C]相似性.因此,我们将填充矩阵中的先前空白 - 以某种方式平滑与此算法的相似性.但除了这种平滑之外,目标是使结果尽可能接近我们在矩阵中的原始数字.