我对Solr很新,并且在设置我的第一个示例核心时遇到错误.我正在尝试在管理仪表板下添加新核心,但我收到有关版本字段的错误.
这有什么解决方法吗?
背景:
架构Xml:
<?xml version="1.0" encoding="UTF-8" ?>
<!--
For fts-solr:
This is the Solr schema file, place it into solr/conf/schema.xml. You may
want to modify the tokenizers and filters.
-->
<schema name="dovecot" version="1.1">
<types>
<!-- IMAP has 32bit unsigned ints but java ints are signed, so use longs -->
<fieldType name="string" class="solr.StrField" omitNorms="true"/>
<fieldType name="boolean" class="solr.BoolField" omitNorms="true"/>
<fieldType name="long" class="solr.LongField" …Run Code Online (Sandbox Code Playgroud) 我们在ElasticSearch实例中有大约55.000.000个文档.我们有一个带有user_ids的CSV文件,最大的CSV有9M条目.我们的文档以user_id为关键,这很方便.
我发布了这个问题,因为我想讨论并有最好的选择来完成这个,因为有不同的方法来解决这个问题.如果用户文档还没有它,我们需要将新的"标签"添加到文档中,例如用"stackoverflow"或"github"标记用户.
update端点.这听起来很慢,因为我们需要迭代超过9M的user_id并为每个用户发出api调用.bulk请求,它提供了一些更好的性能,但在一次通话中可以提到有限的1000-5000文件.并且知道批次何时太大有点知道我们需要在旅途中学习./update_by_query它有很多流量,但没有确认它是在标准版本中实现的.所以问题仍然是最好的方法,如果有人在过去这样做了,请确保你分享你的数字/表现,以及你这次会采取不同的做法.
我试图通过基于字段值提升_score来摆脱Elasticsearch中的排序。这是我的情况:
我的文档中有一个字段:applicationDate。自EPOC以来已经过去了。我希望记录具有更大的applicationDate(最新)以具有更高的分数。
如果两个文档的分数相同,我想在另一个字符串类型的字段上对它们进行排序。说“状态”是另一个可以具有值的字段(可用,正在进行中,已关闭)。因此,具有相同applicationDate的文档应具有基于状态的_score。可用分数应该更高,进行中的分数应该更低,封闭的分数最少。因此,通过这种方式,我不必在获得结果后对文档进行排序。
请给我一些指示。