标签: solr4

Solr:无法搜索与字符混合的数字

我的索引中有一些项目(Solr.4.4),其中包含名称Foobar 135g,其中135g指的是一些权重.搜索foobar或foobar 135工作,但当我尝试搜索确切的短语时foobar 135g,找不到任何内容.

我在solr管理面板"分析"中分析了查询.这里一切都很好看.这些字段被正确编入索引,查询被正确分割,我得到了点击(由令牌上的紫色背景表示).

但是我在索引和/或查询时处理字符串的方式必然存在问题.所以这是字段定义,我正在使用:

<fieldType name="text" class="solr.TextField" omitNorms="false">
  <analyzer type="index">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" catenateWords="1" catenateAll="1" preserveOriginal="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
    <filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="30"/>
    <filter class="solr.ReverseStringFilterFactory" />
    <filter class="solr.EdgeNGramFilterFactory" minGramSize="2" maxGramSize="30"/>
    <filter class="solr.ReverseStringFilterFactory" />
  </analyzer>
  <analyzer type="query">
    <tokenizer class="solr.StandardTokenizerFactory"/>
    <filter class="solr.StandardFilterFactory"/>
    <filter class="solr.WordDelimiterFilterFactory" catenateWords="1" catenateAll="1" preserveOriginal="1"/>
    <filter class="solr.LowerCaseFilterFactory"/>
  </analyzer>
</fieldType>

Run Code Online (Sandbox Code Playgroud)

我正在使用两者的ReverseStringFilterFactory's EdgeNGramFilterFactory能够搜索foob和for bar或obar(出现在项目名称末尾的字符串).首先,我认为,它有事情做与WordDelimiterFilterFactory和catenateWords选项.但是这个选项对数字没有任何作用(我是对的吗？).

在阅读文档(http://wiki.apache.org/solr/AnalyzersTokenizersTokenFilters)后,我发现了generateNumberParts …

solr tokenize sunspot sunspot-solr solr4

23t*_*tux

2014 01-06

4
推荐指数

1
解决办法

5356
查看次数

Solr luceneMatchVersion语法

我有Solr 4.10,我有它的集合,其solorconfig.xml值<luceneMatchVersion>如下:

<luceneMatchVersion>4.7</luceneMatchVersion>

Run Code Online (Sandbox Code Playgroud)

它是否正确？我看到了其他具有价值的例子,比如LUCENE_35我还需要知道什么,我怎样才能LUCENE_xx从我目前的Solr版本中表达出来？

lucene solr solr4

Sai*_*akR

lucky-day

4
推荐指数

1
解决办法

2916
查看次数

如何检查每个字段的solr索引大小

有没有办法检查每个字段的 solr 索引大小？

我们有一个 170G 的大索引大小，我们想弄清楚哪个字段填充了索引大小。

solr datastax-enterprise solr4

Roc*_*ock

lucky-day

4
推荐指数

1
解决办法

1341
查看次数

在 Cent os 7 上将 Apache Solr 从 4.10.4 升级到 6.6.0

如何将 Apache solr 从现有版本 4.10.4 升级到 6.6.0（最新版本）在 linux centos 7 操作系统上。

solr upgrade solr4 centos7 solr6

vik*_*are

lucky-day

4
推荐指数

1
解决办法

3449
查看次数

配置Solr以将UUID用作密钥

我正在尝试配置Solr 4以使用UUID,到目前为止我没有成功

通过阅读文档,我看到了两种不同的方法来配置schema.xml以使用UUID(两者都不起作用)

对于我需要写的两个

<fieldType name="uuid" class="solr.UUIDField" indexed="true" />

Run Code Online (Sandbox Code Playgroud)

选项1:添加:

<field name="id" type="uuid" indexed="true" stored="true" default="NEW" multiValued="false"/>

Run Code Online (Sandbox Code Playgroud)

并确保删除该行

<uniqueKey>id</uniqueKey>

Run Code Online (Sandbox Code Playgroud)

选项2添加:

<field name="id" type="uuid" indexed="true" stored="true" required="true" multiValued="false" />

Run Code Online (Sandbox Code Playgroud)

这两个选项都无法正常工作并返回org.apache.solr.common.SolrException:org.apache.solr.common.SolrException:初始化QueryElevationComponent时出错.

我还尝试使用配置向colrconfig.xml文件添加一行:

<updateRequestProcessorChain name="uuid">
<processor class="solr.UUIDUpdateProcessorFactory"> 
    <str name="fieldName">uniqueKey</str> 
</processor>    
<processor class="solr.RunUpdateProcessorFactory" />
</updateRequestProcessorChain>

Run Code Online (Sandbox Code Playgroud)

谢谢,

西蒙

solr solrj solr4

Shi*_*tar

lucky-day

3
推荐指数

1
解决办法

4712
查看次数

哪个更好的Solr Replication或solr Sharding？

我们构建了庞大的应用程序,因为用户数量很高,这是最好的选择,对我们的应用程序很有用,需要提供对应用程序的无中断支持.

Solr复制好吗？Solr Sharding是好的吗？

replication solr sharding solrcloud solr4

KIR*_*TAM

lucky-day

3
推荐指数

1
解决办法

1751
查看次数

Solr 停用词魔法

我的停用词没有按预期工作。这是我的架构的一部分：

<fieldType name="text_general" class="solr.TextField">
    <analyzer type="index">
        <tokenizer class="solr.KeywordTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
    <analyzer type="query">
        <tokenizer class="solr.KeywordTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="true"/>
        <filter class="solr.LowerCaseFilterFactory"/>
    </analyzer>
</fieldType>

<fieldType class="solr.TextField" name="text_auto">
    <analyzer type="index">
        <charFilter class="solr.HTMLStripCharFilterFactory"/>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="false"/>
        <filter class="solr.LowerCaseFilterFactory"/>
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
        <filter class="solr.ShingleFilterFactory" maxShingleSize="3" outputUnigrams="true" outputUnigramsIfNoShingles="false"/>
    </analyzer>
    <analyzer type="query">
        <filter class="solr.RemoveDuplicatesTokenFilterFactory"/>
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" enablePositionIncrements="false"/>
    </analyzer>
</fieldType>

<field name="deal_title_terms" type="text_auto" indexed="true" stored="false" required="false" multiValued="true"/>

<field name="deal_description" type="text_general" indexed="true" stored="true" required="false" multiValued="false"/> …

Run Code Online (Sandbox Code Playgroud)

lucene search solr stop-words solr4

Ale*_*lka

lucky-day

3
推荐指数

1
解决办法

1万
查看次数

如何为 Sitecore 实现向 Solr 索引中的 _content 字段添加文本？

这是针对 Sitecore 7.5 - Solr 4.7 实现的。我希望能够修改存储在 Solr 的 _content 字段中的文本。我相信，Sitecore 以某种方式聚合了索引中 _content 字段中某个项目的所有内容字段。（我认为这是正确的）在索引时，我希望能够编写自己的代码，该代码可能会修改存储在 Solr 的 _content 字段中的文本。这可能吗？任何想法我会怎么做？

indexing sitecore solr4 sitecore7.5

Cor*_*ett

2015 07-20

3
推荐指数

1
解决办法

1526
查看次数