标签: solr

java - MongoDB + Solr表演

我一直在四处寻找如何将MongoDB与Solr结合使用,这里的一些问题有部分反应,但没有什么真正具体的(更像是理论).在我的应用程序中,我将在MongoDB中存储大量的文档(可能高达数亿),我想对这些文档的某些属性实现全文搜索,所以我猜Solr是最好的方法这个.

我想知道的是我应该如何配置/执行所有内容以使其具有良好的性能？现在,这就是我做的事(我知道它不是最优的):

1-在MongoDB中插入对象时,我将其添加到Solr

SolrServer server = getServer();
SolrInputDocument document = new SolrInputDocument();
document.addField("id", documentId);
...
server.add(document);
server.commit();

Run Code Online (Sandbox Code Playgroud)

2-当更新对象的属性时,由于Solr不能只更新一个字段,首先我从MongoDB中检索对象然后用对象和新属性的所有属性更新Solr索引并执行类似的操作

StreamingUpdateSolrServer update = new StreamingUpdateSolrServer(url, 1, 0);
SolrInputDocument document = new SolrInputDocument();
document.addField("id", documentId);
...
update.add(document);
update.commit();

Run Code Online (Sandbox Code Playgroud)

3-查询时,首先查询Solr,然后在检索文档列表时,SolrDocumentList我会查看每个文档,并且:

获取文档的ID
从MongoDB获取具有相同id的对象,以便能够从那里检索属性

4-删除时,我还没有完成那部分,并且不确定如何在Java中完成

那么有人建议如何以更有效的方式为这里描述的每个场景做到这一点？喜欢这样做的过程,当在Solr中有大量文档并一次添加一个文档时,它不会花费1小时来重建索引？我的要求是用户可能希望一次添加一个文档,我希望他们能够立即检索它

java solr mongodb

Gui*_*ume

lucky-day

25
推荐指数

1
解决办法

5550
查看次数

solr建议者没有返回任何结果

我在这里跟随了solr wiki文章,建议几乎到了T:http://wiki.apache.org/solr/Suggester.我的solrconfig.xml中有以下xml:

<searchComponent class="solr.SpellCheckComponent" name="suggest"> 
     <lst name="spellchecker"> 
     <str name="name">suggest</str> 
     <str name="classname">org.apache.solr.spelling.suggest.Suggester</str> 
     <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str> 
     <str name="field">description</str> 
     <float name="threshold">0.05</float> 
     <str name="buildOnCommit">true</str> 
   </lst> 
</searchComponent> 
<requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest"> 
   <lst name="defaults"> 
     <str name="spellcheck">true</str> 
     <str name="spellcheck.dictionary">suggest</str> 
     <str name="spellcheck.onlyMorePopular">true</str> 
     <str name="spellcheck.count">5</str> 
     <str name="spellcheck.collate">true</str> 
   </lst> 
   <arr name="components"> 
     <str>suggest</str> 
   </arr> 
</requestHandler>

Run Code Online (Sandbox Code Playgroud)

但是,当我运行以下查询(或类似的东西)时:

../suggest/?q=barbequ

Run Code Online (Sandbox Code Playgroud)

我只得到以下结果xml:

<response>
   <lst name="responseHeader">
      <int name="status">0</int>
      <int name="QTime">78</int>
   </lst>
   <lst name="spellcheck">
      <lst name="suggestions"/>
   </lst>
</response>

Run Code Online (Sandbox Code Playgroud)

如您所见,这不是很有帮助.有什么建议可以解决这个问题？

solr spell-checking autosuggest

Mar*_*uis

lucky-day

24
推荐指数

2
解决办法

1万
查看次数

找不到Solr DataImportHandler

我使用 Solr 3.3.0与Tomcat 6.0.26.我能够成功安装Solr,甚至可以使用http:/ localhost:8084/solr/admin访问其Web界面.

现在我想使用它的dataimporthandler来索引我的数据库中的数据.我已经在我的solrconfig中添加了以下内容:

<requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImport
 Handler">
<lst name="defaults">
<str name="config">data-config.xml</str>
</lst>
</requestHandler>

Run Code Online (Sandbox Code Playgroud)

我还在同一目录中创建了一个data-config.xml.

我的solrconfig文件具有dataimport的以下位置

  <lib dir="../../dist/" regex="apache-solr-dataimporthandler-\d.*\.jar" />

Run Code Online (Sandbox Code Playgroud)

我已检查dataimporthandler.jar文件是否存在于dist文件夹中的以下路径C:\ web\solr\example\lib\apache-solr-3.3.0\dist

但每当我键入http:/ localhost:8084/solr/dataimport或http:/ localhost:8084/solr/admin/dataimport时,它表示资源不可用.我认为这是Tomcat设置的一些问题所以我停止了tomcat并尝试使用java -jar start.jar从cmd启动Solr.我得到以下错误

HTTP ERROR 500
Problem accessing /solr/. Reason:
Severe errors in solr configuration.
Check your log files for more detailed information on what may be wrong.
If you want solr to continue after configuration errors, change: 

<abortOnConfigurationError>false</abortOnConfigurationError>

in solr.xml

-------------------------------------------------------------
org.apache.solr.common.SolrException: Error loading class    
    'org.apache.solr.handler.dataimport.DataImportHandler'
at org.apache.solr.core.SolrResourceLoader.findClass(SolrResourceLoader.java:389)
at org.apache.solr.core.SolrCore.createInstance(SolrCore.java:423)
at org.apache.solr.core.SolrCore.createRequestHandler(SolrCore.java:459) …

Run Code Online (Sandbox Code Playgroud)

configuration tomcat solr dataimporthandler

Pri*_*rim

lucky-day

24
推荐指数

2
解决办法

2万
查看次数

如何从solr查询中获取所有结果？

我执行了一些查询,如"地址:杰克*".它显示numFound = 5214并在结果页面中显示100个文档(我将默认显示结果从10更改为100).我怎样才能获得所有文件.

提前致谢...

solr

SEN*_*NAN

2019 07-24

24
推荐指数

3
解决办法

5万
查看次数

如何按日期筛选solr中的查询？

在我的SOLR中有日期字段(published_date),值的格式为"2012-09-26T10:08:09.123Z"

我如何通过简单的输入搜索,如"2012-09-10"而不是完整的ISO日期格式.

SOLR有可能吗？我试过了

fq=[2012-09-24%20TO%20NOW]

它应该通过过滤结果大于发布日期2012-09-24并且小于NOW返回.

但它返回的数据与2012-09-23的发布日期相同,如下所示

<float name="score">2.8183863</float>
<str name="name">Local Team Inspires Obama</str>
<date name="published_date">2012-09-23T07:44:53.123Z</date>

Run Code Online (Sandbox Code Playgroud)

我错过了什么吗？

提前致谢.

solr

作者

lucky-day

24
推荐指数

2
解决办法

6万
查看次数

Solr部分和全字符串匹配

我试图允许搜索Solr中的部分字符串,所以如果有人搜索"ppopota",他们会得到与搜索"hippopotamus"相同的结果.我上下阅读文档,觉得我已经筋疲力尽了.到目前为止,我有以下内容:

定义新字段类型:

<fieldtype name="testedgengrams" class="solr.TextField">
   <analyzer>
     <tokenizer class="solr.LowerCaseTokenizerFactory"/>
     <filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="15" side="front"/>
  </analyzer>
</fieldtype>

Run Code Online (Sandbox Code Playgroud)

定义"testsgengrams"类型的字段:

<field name="text_ngrams" type="testedgengrams" indexed="true" stored="false"/>

Run Code Online (Sandbox Code Playgroud)

将text_ngrams的内容复制到文本中:

<copyField source="text_ngrams" dest="text"/>

Run Code Online (Sandbox Code Playgroud)

唉,这不起作用.我错过了什么？

lucene search solr

Scr*_*ead

2011 11-20

23
推荐指数

4
解决办法

3万
查看次数

Solr Query - HTTP错误404未定义的字段文本

我使用Solr下载附带的默认Jetty服务器在我的Ubuntu机器上运行了一个Solr实例.每当我开始使用Solr时

java -jar start.jar

服务器启动正常但总是抛出一个异常:

INFO: SolrDispatchFilter.init() done
Apr 12, 2012 2:01:56 PM org.apache.solr.common.SolrException log
SEVERE: org.apache.solr.common.SolrException: undefined field text

Run Code Online (Sandbox Code Playgroud)

正如我所说,服务器仍将启动,我可以看到Solr管理界面.我定义了我的架构如下.

<fields>
    <field name="id" type="string" indexed="true" stored="true" />
    <field name="phraseID" type="int" indexed="true" stored="true" />
    <field name="translation" type="string" indexed="true" stored="true" />
</fields>
<uniqueKey>id</uniqueKey>

Run Code Online (Sandbox Code Playgroud)

我还能够执行JSON更新 - 我提交了一个被接受的示例数据数组.到目前为止,一切都很好.

当我尝试运行查询时:

http://localhost:8983/solr/select/?q=*:*&version=2.2&start=0&rows=10&indent=on

Run Code Online (Sandbox Code Playgroud)

它正确地返回我之前在示例中提交的所有数据.

但是,当我尝试使用文本查询时,我收到HTTP错误404.

http://localhost:8983/solr/select/?q=fruit&version=2.2&start=0&rows=10&indent=on

--- returns ---

HTTP ERROR 400

Problem accessing /solr/select/. Reason:

    undefined field text
Powered by Jetty://

Run Code Online (Sandbox Code Playgroud)

lucene solr

Jar*_*les

lucky-day

23
推荐指数

2
解决办法

3万
查看次数

Solr 4.0是否能够为多个核心使用"join"？

我注意到Solr 4.0为具有关系的文档引入了"join"功能.这很好,但是,我注意到http://wiki.apache.org/solr/Join给出的示例是单核,所有文档都在单个索引中.

有人知道我是否可以使用'join'作为多核心？

lucene solr join

zx_*_*ing

lucky-day

23
推荐指数

1
解决办法

2万
查看次数

SOLR autoCommit vs autoSoftCommit

我很困惑和.这是我的理解

autoSoftCommit - 在autoSoftCommit之后,如果SOLR服务器出现故障,autoSoftCommit文件将丢失.
autoCommit - 对磁盘进行硬提交,并确保将所有autoSoftCommit提交写入磁盘并提交任何其他文档.

我的以下配置似乎只与autoSoftCommit一起使用.autoCommit本身似乎没有做任何提交.有什么我想念的吗？

<updateHandler class="solr.DirectUpdateHandler2">
    <updateLog>
        <str name="dir">${solr.ulog.dir:}</str>
    </updateLog>
   <autoSoftCommit>
        <maxDocs>1000</maxDocs>
        <maxTime>1200000</maxTime>
    </autoSoftCommit>
    <autoCommit>
        <maxDocs>10000</maxDocs>
        <maxTime>120000</maxTime> 
        <openSearcher>false</openSearcher>
    </autoCommit>
</updateHandler>

Run Code Online (Sandbox Code Playgroud)

为什么autoCommit会自己动手？

solr solr4

haj*_*ime

2013 07-15

23
推荐指数

2
解决办法

2万
查看次数