Java中的搜索引擎算法?

jam*_*mes 2 java information-retrieval search-engine

好吧,我真的是这个网站的新手,我认为这只是2个小时所以我需要一段时间才能习惯这个网站并提出不符合指南的问题.

我所要做的就是实现一个小型搜索引擎,它不是功课或工作,我只会为了学习而获得报酬.

serch引擎将具有简单的用户界面,用户可以提出问题并显示结果.

这个结果显然需要组织起来,它需要显示它找到的结果数量,最相关的结果将显示在顶部.它还有链接到它找到的材料.我在java中有一些经验,因此我需要一个算法来实现它.

有一百万种不同的搜索引擎,有些是用PHP和其他语言编写的,但是它们已经实现了,我需要从头开始实现这个算法.

我为了这个目的买了一本名为"算法导论"的书,但这并不像我认为的那样有用.我需要java中的一些指南,这是我需要以代码的形式做的菜单.

如果有人能提供帮助,我将非常感激.谢谢

ami*_*mit 8

您可以使用Apache Lucene库,它是一个基于Java的成熟信息检索系统.
您必须创建一个IndexWriter,并使用它来索引您的文档集合.
然后,您应该使用IndexSearcher搜索文档.请阅读文档,因为您可能已经构建了所有需要的文档.

如果你想从头开始实现它,我建议先阅读有关信息检索的内容.一个很好的资源来源是信息检索简介