我们对搜索引擎的更换有一系列相当困难的要求,它们如下。
我们正在考虑将半频繁/频繁更新的字段放入子文档中。问题在于,我们有一组标签在我们想要近实时搜索的记录上经常更改。我们的应用程序强烈期望当这些数据被修改时,搜索会立即反映出来。我们尝试过子文档,但它们在大型数据集上的更新速度似乎没有我们希望的那么快。
所以问题如下:
希望这对其他人在这种情况下有所帮助,这是我想出的解决方案。
由于我已将要索引的记录数据拆分为静态和非静态文档,然后将该非静态数据分解为更多子文档,因此我能够创建高吞吐量索引器。要索引的记录总数被拆分为子块,然后进一步拆分为其子文档类型。我会将这些块拆分为各种索引器实例,然后这些实例将仅受数据源或 ES 集群的吞吐量限制,以确定每秒可以对多少文档建立索引。
这一切都是通过批量 API 完成的。使静态数据远离频繁变化的数据使得经常变化的数据能够相当快地更新,并且该速度仅受可用硬件的限制。使用子文档子句和聚合来编写查询有点困难,但一切似乎都有效。
笔记
| 归档时间: |
|
| 查看次数: |
1185 次 |
| 最近记录: |