我有一个索引,包含大量纸张,同一个字段的值相同.我在这个领域有一个重复数据删除.
聚合器将作为柜台来找我.我想要一份文件清单.
我的索引:
我想要这个结果(域名重复数据删除结果):
deduplication elasticsearch
我的所有文档都有一个uid带有ID 的字段,用于将文档链接到用户.有多个文件相同uid.
uid
我想对所有文档执行搜索,只返回每个唯一的最高得分文档uid.
选择相关文档的multi_match查询是简单查询.
multi_match
elasticsearch
elasticsearch ×2
deduplication ×1