作为示例,我有一个文本字段,可能包含以下字符串:
"d7199 ^^ == ^^ 81 ^^ == ^^一两句话!"
我想对这些数据进行标记,但每个标记都包含字符串的第一部分.所以,我希望上面的示例中的标记看起来像这样:
"d7199 ^^ == ^^ 81 ^^ == ^^一个"
"d7199 ^^ == ^^ 81 ^^ == ^^句子"
"d7199 ^^ == ^^ 81 ^^ == ^^或"
"d7199 ^^ == ^^ 81 ^^ == ^^两个"
我该怎么做呢?
我是Solr的新手,我很好奇改变/更新架构的程序是什么?
我注意到我可以轻松地添加新字段而不会引起任何问题,但是任何时候我不得不更新字段,这都会导致问题.
由于提取到系统中的数据量很大,我将无法保留用于生成solr的add/doc查询的原始数据,因此当发生更改时,我将无法简单地重新索引所有内容.
例如,我希望将现有字段从"字符串"类型更改为"文本",文本字段类型具有许多我想在现有数据上立即使用的标记器,过滤器等.
我理想地寻找一种方法来更新模式,重新索引/优化现有数据集,并能够跟踪操作完成所需的时间.
如果有人能帮助我理解这一点我会非常感激!