本地/离线网站“站点”的全文搜索

use*_*226 5 javascript lucene solr full-text-search

可能的重复:
通过 javascript 对 CD-Rom 上的静态 HTML 文件进行全文搜索

我正在开始开发一个应用程序,该应用程序在本地创建一堆 HTML 文件,然后可以在复制到的系统(包括移动设备)上的任何 Web 浏览器中浏览这些文件。HTML 文件具有许多交互功能,因此它本质上是一个离线网络应用程序。我的问题是,对这些 HTML 文件实现全文搜索的最佳方法是什么?基本上,应用程序应该对其生成的 HTML 文件建立索引,但我们希望能够使 HTML 文件和生成的索引可下载并可供用户离线浏览和搜索。在不编写实际应用程序来管理它的情况下执行此操作的最佳方法是什么?例如,我使用 Solr 来实现它以进行演示/概念验证,效果很好……但是当然,这需要向服务器发出 HTTP POST 和 GET 请求以进行索引和查询。因此,由于索引实际上只是文件,我想知道是否有一种方法可以仅使用 HTML 文件中的 Javascript(也许使用 Lucene 而不是 Solr)来离线查询它们(并且无需为 Solr 启动本地 Web 服务器)?

Jes*_*ose 1

感谢您向我介绍了一些完全用 Javascript 编写的文本搜索解决方案!我想查看文本搜索的代码。


Lucene是用Java编写的,需要Java(技术上是JVM)进程来访问。

PS1:如果您要进行自己的简单文本搜索,JS 中的词干分析器将使其更加有用。

original: run running cat cats love loving crap crapping
stemmed: run run cat cat love love crap crap 
Run Code Online (Sandbox Code Playgroud)

PS2:您也可以运行另一个“Ngram-ized”索引来进行拼写检查。