如何计算同一MongoDB聚合$ group查询中的多个键?

fri*_*mer 9 mongodb aggregation-framework

我有一个问题:

db.test.aggregate( {$group : { _id : '$key', frequency: { $sum : 1 } } } )
Run Code Online (Sandbox Code Playgroud)

这将获得测试集中每个密钥枚举的频率.基本上,我已经得到了密钥的分配.

现在想象一下我想获得key1,key2和key3的分布(因此有三种不同的分布).

显然,我可以使用每个单独的键运行此查询3次,但似乎我们可以通过允许它同时计算所有3个键来优化查询.我一直在玩它并搜索整个网络间,但到目前为止,我已经被委托运行三个单独的聚合查询或使用map/reduce函数.

有没有人有任何其他想法?

3rf*_*3rf 6

您可以在此处使用几种不同的方法:

  1. 使用map/reduce:不要这样做.现在,运行聚合框架3次比使用这个用例的map reduce函数要快得多.

  2. 运行聚合3次.这不是最佳选择,但如果您没有时间限制,那么这是最简单的选择.如果你的聚合反正需要几秒钟,那么我不会担心优化,直到它们成为一个问题.

  3. 这是我能想到的最佳解决方案.该$group运营商允许你建立一个_id对多个字段.例如{"_id":{"a":"$key1", "b":"$key2", "c":"$key3"}}.这样做会为不同键的所有现有组合创建分组.您可以通过这种方式对密钥进行分组,然后在客户端中手动对结果进行求和.

让我详细说明一下.假设我们有一组形状.这些形状可以具有颜色,大小和种类(方形,圆形等).多键ID上的聚合可能如下所示:

db.shapes.aggregate({$group:{_id:{"f1":"$f1", "f2":"$f2", "f3":"$f3"}, count:{"$sum":1}}})
Run Code Online (Sandbox Code Playgroud)

并返回:

"result" : [
        {
            "_id" : {
                "f1" : "yellow",
                "f2" : "medium",
                "f3" : "triangle"
            },
            "count" : 4086
        },
        {
            "_id" : {
                "f1" : "red",
                "f2" : "small",
                "f3" : "triangle"
            },
            "count" : 4138
        },
        {
            "_id" : {
                "f1" : "red",
                "f2" : "big",
                "f3" : "square"
            },
            "count" : 4113
        },
        {
            "_id" : {
                "f1" : "yellow",
                "f2" : "small",
                "f3" : "triangle"
            },
            "count" : 4145
        },
        {
            "_id" : {
                "f1" : "red",
                "f2" : "small",
                "f3" : "square"
            },
            "count" : 4062
        }
Run Code Online (Sandbox Code Playgroud)

... 等等

然后,您将通过大幅减少的条目数量总结客户端的结果.假设每个密钥的唯一值的数量与文档总数相比足够小,您可以在可忽略的时间内完成此最后一步.