我有一个索引,包含大量纸张,同一个字段的值相同.我在这个领域有一个重复数据删除.
聚合器将作为柜台来找我.我想要一份文件清单.
我的索引:
我想要这个结果(域名重复数据删除结果):
deduplication elasticsearch
一些记录在由数字字段标识的索引中重复recordid.
recordid
elasticsearch中有delete-by-query,我可以用它来删除任何一个重复记录吗?
或者其他一些方法来实现这一目标?
elasticsearch
elasticsearch ×2
deduplication ×1