相关疑难解决方法(0)

从Elasticsearch中的搜索中删除重复的文档

我有一个索引,包含大量纸张,同一个字段的值相同.我在这个领域有一个重复数据删除.

聚合器将作为柜台来找我.我想要一份文件清单.

我的索引:

  • Doc 1 {domain:'domain1.fr',name:'name1',date:'01 -01-2014'}
  • Doc 2 {domain:'domain1.fr',name:'name1',date:'01 -02-2014'}
  • Doc 3 {domain:'domain2.fr',name:'name2',date:'01 -03-2014'}
  • Doc 4 {domain:'domain2.fr',name:'name2',date:'01 -04-2014'}
  • Doc 5 {domain:'domain3.fr',name:'name3',date:'01 -05-2014'}
  • Doc 6 {domain:'domain3.fr',name:'name3',date:'01 -06-2014'}

我想要这个结果(域名重复数据删除结果):

  • Doc 6 {domain:'domain3.fr',name:'name3',date:'01 -06-2014'}
  • Doc 4 {domain:'domain2.fr',name:'name2',date:'01 -04-2014'}
  • Doc 2 {domain:'domain1.fr',name:'name1',date:'01 -02-2014'}

deduplication elasticsearch

25
推荐指数
1
解决办法
2万
查看次数

Elasticsearch删除重复项

一些记录在由数字字段标识的索引中重复recordid.

elasticsearch中有delete-by-query,我可以用它来删除任何一个重复记录吗?

或者其他一些方法来实现这一目标?

elasticsearch

12
推荐指数
2
解决办法
6591
查看次数

标签 统计

elasticsearch ×2

deduplication ×1