Rav*_*ina 4 information-retrieval
我已经阅读了 stanford 网站上的Permutterm 索引页面,但是我仍然无法弄清楚我们如何从:*X*到X*.
那么在哪里$呢?
我可以得到这些:
For X, look up X$
For X*, look up $X*
For *X, look up X$*
For X*Y, look up Y$X*
Run Code Online (Sandbox Code Playgroud)
小智 5
Permutterm Index 背后的想法是旋转通配符查询,以便 *结束。
因此,您将模糊查询转换为可比较查询。正如你写,查找$ X *查询X *因为*是不确定的,但一开始的部分X是确定性的。
说到X,我们有两颗星。问题是我们应该旋转哪颗星。
旋转第一颗星
你把X*当作Y 的一部分,那么我们得到*Y。所以我们应该查找Y$*,它是X*$*,相当于X*。
旋转第二颗星
你把*X当作Y 的一部分,那么我们得到Y*。所以我们应该查找*$Y,也就是*$*X。这不容易处理。
基于这一点,我们就可以知道为什么我们查找X *当我们查询,如* X *。原因不是$是$表示单词的结尾,而我们的查询不包含有关结尾的信息。