小编dav*_*avr的帖子

与自定义Web应用程序集成的最佳文本搜索引擎?

我们有一个网络应用程序,允许用户上载文档,创建自己的文档等。上传的文件存储在Amazon S3上,创建的信息存储在MySQL数据库中。我要寻找的是某种搜索引擎,在其中向我们提供所有文本文档(每个文档都有唯一的ID),并建立索引或其他内容。稍后,我可以给它提供搜索查询,它将检索出最佳匹配的文档(通过其ID),以及匹配的文本片段。

基本上,我们希望允许我们的用户搜索他们上传的资料的存储库,以及其他用户标记为公开的内容。该解决方案应该在标准的Linux服务器上运行,并且理想情况下将是开源的,但是如果价格不算太高,我还将考虑使用付费解决方案。

到目前为止,我已经找到了三个潜在的候选人:

  1. MySQL全文搜索 -我读过的一些报告说它很慢
  2. Apache Lucene-不幸的是用Java编写,但是如果需要的话,我会用它。据说快
  3. Sphinx-似乎不那么受欢迎,理想情况下,我发现的任何解决方案都将得到社区的大力支持。

如果我忽略了其他任何不错的选择,或者您有以上任何经验,请告诉我。

linux search full-text-search web-applications

4
推荐指数
1
解决办法
1488
查看次数

从远程SVN存储库检出到远程位置?

有没有办法让SVN从远程存储库检出另一个远程位置而不是本地文件系统?就像是:

svn co http://myrepository/svn/project ssh me@otherlocation.net:/var/www/project
Run Code Online (Sandbox Code Playgroud)

svn ssh

3
推荐指数
1
解决办法
3463
查看次数

优化AS3 SWF文件的大小?

是否有任何提示/最佳实践/秘密来优化AS3 SWF文件的大小?特别是,任何方法都可以分析SWF中占用空间的内容,就像以前在旧的Flash 7/8天中一样?我不再使用Flash IDE,但现在我使用的是Flex Builder或FlashDevelop,所以它需要是我可以在没有Flash IDE的情况下完成的事情.

flash optimization actionscript-3

2
推荐指数
1
解决办法
4176
查看次数

为什么MySQL不使用此子查询的索引?

我曾经这样做过:

SELECT layerID
FROM layers
WHERE ownerID = ?
AND collectionID = ?
Run Code Online (Sandbox Code Playgroud)

哪个会给我一个layerID的数组,然后我循环并为每个执行此操作:

SELECT DATA
FROM drawings
WHERE layerID = ?
Run Code Online (Sandbox Code Playgroud)

这一切都很好.所以现在我试图一步到位,所以我试试这个:

SELECT DATA , layerID
FROM drawings
WHERE layerID = ANY (
  SELECT layerID
  FROM layers
  WHERE ownerID = ?
  AND collectionID = ?
) 
Run Code Online (Sandbox Code Playgroud)

但由于某种原因,它不使用索引,对于主查询,SELECT DATA etc!因此,这个组合查询需要花费更长的时间来完成,而不是之前我做过的单独查询.(顺便说一句,子查询SELECT layerID etc仍然使用索引).

我已经通过使用'EXPLAIN'语句确定它是否正在使用查询.

我对个别指标ownerIDcollectionID在列layers表中,并在layerIDdrawings表.

我的查询错误是什么?

mysql indexing optimization subquery

0
推荐指数
1
解决办法
1035
查看次数