置换项索引是如何工作的?

Rav*_*ina 4 information-retrieval

我已经阅读了 stanford 网站上的Permutterm 索引页面,但是我仍然无法弄清楚我们如何从:*X*X*.

那么在哪里$呢?


我可以得到这些:

For X, look up X$
For X*, look up $X*
For *X, look up X$*
For X*Y, look up Y$X*
Run Code Online (Sandbox Code Playgroud)

小智 5

Permutterm Index 背后的想法是旋转通配符查询,以便 *结束。

因此,您将模糊查询转换为可比较查询。正如你写,查找$ X *查询X *因为*是不确定的,但一开始的部分X是确定性的。

说到X,我们有两颗星。问题是我们应该旋转哪颗星。

  1. 旋转第一颗星

    你把X*当作Y 的一部分,那么我们得到*Y。所以我们应该查找Y$*,它是X*$*,相当于X*

  2. 旋转第二颗星

    你把*X当作Y 的一部分,那么我们得到Y*。所以我们应该查找*$Y,也就是*$*X。这不容易处理。

基于这一点,我们就可以知道为什么我们查找X *当我们查询,如* X *。原因不是$$表示单词的结尾,而我们的查询不包含有关结尾的信息。