标签: full-text-search

全文搜索引擎的比较 - Lucene,Sphinx,Postgresql,MySQL?

我正在建立一个Django网站,我正在寻找一个搜索引擎.

一些候选人:

  • Lucene/Lucene与Compass/Solr

  • 狮身人面像

  • Postgresql内置全文搜索

  • MySQl内置全文搜索

选择标准:

  • 结果相关性和排名
  • 搜索和索引速度
  • 易于使用,易于与Django集成
  • 资源需求 - 站点将托管在VPS上,因此理想情况下搜索引擎不需要大量的RAM和CPU
  • 可扩展性
  • 额外的功能,如"你的意思是?",相关的搜索等

任何有上述搜索引擎经验的人,或者不在列表中的其他引擎 - 我很想听听你的意见.

编辑:至于索引需求,当用户不断将数据输入网站时,这些数据需要连续编入索引.它不一定是实时的,但理想情况下,新数据会出现在索引中,延迟时间不超过15-30分钟

mysql lucene postgresql full-text-search sphinx

308
推荐指数
7
解决办法
14万
查看次数

Elasticsearch中的碎片和副本

我试图了解Elasticsearch中的碎片和副本是什么,但我无法理解它.如果我下载Elasticsearch并运行脚本,那么据我所知,我已经启动了一个具有单个节点的集群.现在这个节点(我的PC)有5个分片(?)和一些副本(?).

他们是什么,我有5个重复的索引?如果是这样的话?我需要一些解释.

full-text-search elasticsearch

270
推荐指数
8
解决办法
7万
查看次数

如何搜索多个pdf文件的内容?

我怎样才能在目录/子目录中搜索PDF文件的内容?我正在寻找一些命令行工具.似乎grep无法搜索PDF文件.

linux pdf debian grep full-text-search

208
推荐指数
6
解决办法
10万
查看次数

初学者的ElasticSearch指南

没有任何关于ElasticSearch的书籍(我知道),http: //www.elasticsearch.org/guide /似乎只包含参考文献.

任何好的初学者指南或教程,也许通过例子,推荐,特别是在不同的映射和索引策略方面?

search full-text-search elasticsearch

207
推荐指数
4
解决办法
8万
查看次数

选择独立的全文搜索服务器:Sphinx还是SOLR?

我正在寻找具有以下属性的独立全文搜索服务器:

  • 必须作为可以为多个客户端提供搜索请求的独立服务器运行
  • 必须能够通过索引SQL查询的结果来进行"批量索引":例如"SELECT id,text_to_index FROM documents;"
  • 必须是免费软件,必须在Linux上以MySQL作为数据库运行
  • 必须快(排除MySQL的内部全文搜索)

我发现具有这些属性的替代方案是:

  • Solr(基于Lucene)
  • ElasticSearch(也基于Lucene)
  • 狮身人面像

我的问题:

  • 他们如何比较?
  • 我错过了任何其他选择吗?
  • 我知道,每个用例是不同的,但是否有某些情况下,我肯定希望使用某个软件包?

mysql lucene solr full-text-search sphinx

192
推荐指数
4
解决办法
5万
查看次数

在没有索引的情况下搜索文件中的字符串的工具

我必须在一个令人难以置信的旧遗留应用程序中更改一些连接字符串,并且制作它的程序员认为用连接字符串遍布整个应用程序是个好主意.

Visual Studio的"当前项目"搜索速度令人难以置信,我不相信Windows搜索.

那么,那里最好的免费,非索引文本搜索工具是什么?它应该做的就是返回一个列表,其中包含文件夹及其子文件夹中包含所需字符串的文件.

我正在运行Windows 2003 Server.

search full-text-search text-files

166
推荐指数
9
解决办法
34万
查看次数

搜索颠覆历史(全文)

有没有办法对subversion存储库执行全文搜索,包括所有历史记录?

例如,我编写了一个我在某个地方使用过的功能,但之后就不需要了,所以我对这些文件进行了调整,但现在我需要再次找到它以将其用于其他内容.svn日志可能会说"删除未使用的东西"之类的内容,并且有大量的签名.

编辑2016-04-15:请注意,术语"全文搜索"在这里提到的是搜索提交历史的实际差异,而不是文件名和/或提交消息.我指出这一点是因为上面的作者的措词并没有很好地反映出来 - 因为在他的例子中他也可能只是寻找文件名和/或提交消息.因此有很多svn log答案和评论.

svn full-text-search

129
推荐指数
9
解决办法
7万
查看次数

什么是全文搜索与LIKE

我刚看了一篇在SQL中提到"全文搜索"的帖子.

我只是想知道FTS和LIKE之间的区别是什么.我确实阅读了几篇文章,但找不到任何解释得很好的文章.

sql full-text-search sql-like

124
推荐指数
5
解决办法
6万
查看次数

使用InnoDB进行全文搜索

我正在开发一个高容量的Web应用程序,其中一部分是一个讨论帖子的MySQL数据库,需要平滑地增长到20M +行.

我原本打算在桌子上使用MyISAM(用于内置的全文搜索功能),但由于单次写入操作而导致整个表被锁定的想法使我快门.行级锁更有意义(更不用说InnoDB在处理大型表时的其他速度优势).所以,出于这个原因,我非常决定使用InnoDB.

问题是...... InnoDB没有内置的全文搜索功能.

我应该使用第三方搜索系统吗?像Lucene(c ++)/Sphinx?你们这些数据库忍者有什么建议/指导吗?LinkedIn的zoie(基于Lucene)看起来是目前最好的选择...围绕实时功能构建(这对我的应用程序来说非常关键.)如果没有一些洞察力,我有点犹豫不决...

(仅供参考:将使用高内存装备在EC2上,使用PHP来提供前端)

mysql sql search innodb full-text-search

93
推荐指数
3
解决办法
7万
查看次数

什么是分面搜索?

在全文搜索的背景下,究竟什么是分面搜索?

我甚至从维基百科上读过它,但我无法完全理解它的用途/好处.希望社区能够通过一些好的例子来回答/扩展和解释.

注意:我们正在进行评估/研究不同开放式搜索全文搜索引擎的过程,而且大多数情况下我都将分面搜索列为其中一项功能.所以我试图评估这是否有助于我们的应用程序要求.

database search full-text-search faceted-search

87
推荐指数
2
解决办法
4万
查看次数