Mongo为两个或多个字段的条目查找重复项

Har*_*vic 18 mongodb mongodb-query aggregation-framework

我有这样的文件:

{
    "_id" : ObjectId("557eaf444ba222d545c3dffc"),
    "foreing" : ObjectId("538726124ba2222c0c0248ae"),
    "value" : "test",
}
Run Code Online (Sandbox Code Playgroud)

我想找到已复制的值对所有文件foreingvalue.

chr*_*dam 27

您可以通过运行以下聚合管道操作轻松识别重复项:

db.collection.aggregate([
    { 
        "$group": { 
            "_id": { "foreing": "$foreing", "value": "$value" }, 
            "uniqueIds": { "$addToSet": "$_id" },
            "count": { "$sum": 1 } 
        }
    }, 
    { "$match": { "count": { "$gt": 1 } } }
])
Run Code Online (Sandbox Code Playgroud)

$group第一步中的操作符用于按文件foreignvalue键值对文档进行分组,然后使用操作符_id为每个分组文档创建一个值数组作为uniqueIds字段$addToSet.这为您提供了每组的唯一表达式值数组.获取在$sum运营商的后续管道阶段中使用的分组文档总数.

在第二个管道阶段,使用$match运算符过滤掉计数为1的所有文档.过滤掉的文档表示唯一索引键.

其余文档将是集合中具有对foreing&的重复键值的文档value.

  • 真的很神奇,首先我遇到了磁盘错误,所以我传递了第二个参数来允许磁盘`...,{allowDiskUse:true}` (3认同)

Nis*_*ant 13

我们只需要在2个键的基础上进行分组,并选择计数大于1的元素,以查找重复项.

查询: - 会是这样的

db.mycollection.aggregate(
    { $group: { 
        _id: { foreing: "$foreing", value: "$value" },
        count: { $sum:  1 },
        docs: { $push: "$_id" }
    }},
    { $match: {
        count: { $gt : 1 }
    }}
)
Run Code Online (Sandbox Code Playgroud)

输出: - 会是这样的

{
    "result" : [
        {
            "_id" : {
                "foreing" : 1,
                "value" : 2
            },
            "count" : 2,
            "docs" : [
                ObjectId("34567887654345678987"),
                ObjectId("34567887654345678987")
            ]
        }
    ],
    "ok" : 1
}
Run Code Online (Sandbox Code Playgroud)

参考链接: - 如何查找具有相同字段的mongo文档