小编Jas*_*mer的帖子

Solr Tokenizer Injection

作为示例,我有一个文本字段,可能包含以下字符串:

"d7199 ^^ == ^^ 81 ^^ == ^^一两句话!"

我想对这些数据进行标记,但每个标记都包含字符串的第一部分.所以,我希望上面的示例中的标记看起来像这样:

"d7199 ^^ == ^^ 81 ^^ == ^^一个"

"d7199 ^^ == ^^ 81 ^^ == ^^句子"

"d7199 ^^ == ^^ 81 ^^ == ^^或"

"d7199 ^^ == ^^ 81 ^^ == ^^两个"

我该怎么做呢?

solr tokenize

5
推荐指数
1
解决办法
607
查看次数

更新Solr架构

我是Solr的新手,我很好奇改变/更新架构的程序是什么?

我注意到我可以轻松地添加新字段而不会引起任何问题,但是任何时候我不得不更新字段,这都会导致问题.

由于提取到系统中的数据量很大,我将无法保留用于生成solr的add/doc查询的原始数据,因此当发生更改时,我将无法简单地重新索引所有内容.

例如,我希望将现有字段从"字符串"类型更改为"文本",文本字段类型具有许多我想在现有数据上立即使用的标记器,过滤器等.

我理想地寻找一种方法来更新模式,重新索引/优化现有数据集,并能够跟踪操作完成所需的时间.

如果有人能帮助我理解这一点我会非常感激!

lucene solr

2
推荐指数
1
解决办法
3782
查看次数

标签 统计

solr ×2

lucene ×1

tokenize ×1