我正在建立一个Django网站,我正在寻找一个搜索引擎.
一些候选人:
Lucene/Lucene与Compass/Solr
狮身人面像
Postgresql内置全文搜索
MySQl内置全文搜索
选择标准:
任何有上述搜索引擎经验的人,或者不在列表中的其他引擎 - 我很想听听你的意见.
编辑:至于索引需求,当用户不断将数据输入网站时,这些数据需要连续编入索引.它不一定是实时的,但理想情况下,新数据会出现在索引中,延迟时间不超过15-30分钟
我试图了解Elasticsearch中的碎片和副本是什么,但我无法理解它.如果我下载Elasticsearch并运行脚本,那么据我所知,我已经启动了一个具有单个节点的集群.现在这个节点(我的PC)有5个分片(?)和一些副本(?).
他们是什么,我有5个重复的索引?如果是这样的话?我需要一些解释.
我怎样才能在目录/子目录中搜索PDF文件的内容?我正在寻找一些命令行工具.似乎grep
无法搜索PDF文件.
我正在寻找具有以下属性的独立全文搜索服务器:
我发现具有这些属性的替代方案是:
我的问题:
我必须在一个令人难以置信的旧遗留应用程序中更改一些连接字符串,并且制作它的程序员认为用连接字符串遍布整个应用程序是个好主意.
Visual Studio的"当前项目"搜索速度令人难以置信,我不相信Windows搜索.
那么,那里最好的免费,非索引文本搜索工具是什么?它应该做的就是返回一个列表,其中包含文件夹及其子文件夹中包含所需字符串的文件.
我正在运行Windows 2003 Server.
有没有办法对subversion存储库执行全文搜索,包括所有历史记录?
例如,我编写了一个我在某个地方使用过的功能,但之后就不需要了,所以我对这些文件进行了调整,但现在我需要再次找到它以将其用于其他内容.svn日志可能会说"删除未使用的东西"之类的内容,并且有大量的签名.
编辑2016-04-15:请注意,术语"全文搜索"在这里提到的是搜索提交历史的实际差异,而不是文件名和/或提交消息.我指出这一点是因为上面的作者的措词并没有很好地反映出来 - 因为在他的例子中他也可能只是寻找文件名和/或提交消息.因此有很多svn log
答案和评论.
我刚看了一篇在SQL中提到"全文搜索"的帖子.
我只是想知道FTS和LIKE之间的区别是什么.我确实阅读了几篇文章,但找不到任何解释得很好的文章.
我正在开发一个高容量的Web应用程序,其中一部分是一个讨论帖子的MySQL数据库,需要平滑地增长到20M +行.
我原本打算在桌子上使用MyISAM(用于内置的全文搜索功能),但由于单次写入操作而导致整个表被锁定的想法使我快门.行级锁更有意义(更不用说InnoDB在处理大型表时的其他速度优势).所以,出于这个原因,我非常决定使用InnoDB.
问题是...... InnoDB没有内置的全文搜索功能.
我应该使用第三方搜索系统吗?像Lucene(c ++)/Sphinx?你们这些数据库忍者有什么建议/指导吗?LinkedIn的zoie(基于Lucene)看起来是目前最好的选择...围绕实时功能构建(这对我的应用程序来说非常关键.)如果没有一些洞察力,我有点犹豫不决...
(仅供参考:将使用高内存装备在EC2上,使用PHP来提供前端)
在全文搜索的背景下,究竟什么是分面搜索?
我甚至从维基百科上读过它,但我无法完全理解它的用途/好处.希望社区能够通过一些好的例子来回答/扩展和解释.
注意:我们正在进行评估/研究不同开放式搜索全文搜索引擎的过程,而且大多数情况下我都将分面搜索列为其中一项功能.所以我试图评估这是否有助于我们的应用程序要求.