Ace*_*Ace 2 java search-engine
我的搜索引擎使用以下函数来计算相关性.
private static int calculateScore(String result, String searchStr, int modifier)
{
String[] resultWords = result.split(" ");
String[] searchWords = searchStr.split(" ");
int score = 0;
for (String searchWord : searchWords)
{
for (String resultWord : resultWords)
{
if (resultWord.equals(searchWord))
score += 10;
else if (resultWord.startsWith(searchWord))
score += 4;
else if (resultWord.endsWith(searchWord))
score += 3;
else if (resultWord.contains(searchWord))
score += 1;
}
}
return score;
}
Run Code Online (Sandbox Code Playgroud)
没有什么花哨的,而且我也没有足够的时间去做任何花哨的事情,但是我是否有任何简单的改进可以使功能更好地提升相关的东西,并保持不相关的东西?无需评论速度优化,这只是函数的"功能部分":)
谢谢.
经典的矢量空间模型实际上是标准的,非常简单(在实现中)的解决方案.
http://www.miislita.com/term-vector/term-vector-3.html
| 归档时间: |
|
| 查看次数: |
202 次 |
| 最近记录: |