使用组计数获取$ group结果

Mer*_*rvS 25 mongodb mongodb-query aggregation-framework

假设我有一个名为"posts"的集合(实际上它是一个更复杂的集合,帖子太简单了),具有以下结构:

> db.posts.find()

{ "_id" : ObjectId("50ad8d451d41c8fc58000003"), "title" : "Lorem ipsum", "author" : 
"John Doe", "content" : "This is the content", "tags" : [ "SOME", "RANDOM", "TAGS" ] }
Run Code Online (Sandbox Code Playgroud)

我希望这个集合能够跨越数十万甚至数百万,我需要按标签查询帖子并按标签对结果进行分组并显示分页结果.这就是聚合框架的用武之地.我计划使用aggregate()方法来查询集合:

db.posts.aggregate([
  { "$unwind" : "$tags" },
  { "$group" : {
      _id: { tag: "$tags" },
      count: { $sum: 1 }
  } }
]);
Run Code Online (Sandbox Code Playgroud)

问题是要创建分页符,我需要知道输出数组的长度.我知道要做到这一点你可以这样做:

db.posts.aggregate([
  { "$unwind" : "$tags" },
  { "$group" : {
      _id: { tag: "$tags" },
      count: { $sum: 1 }
  } }
  { "$group" : {
      _id: null,
      total: { $sum: 1 }
  } }
]);
Run Code Online (Sandbox Code Playgroud)

但这会丢弃先前管道(第一组)的输出.有没有办法在保留每个管道输出的同时组合两个操作?我知道整个聚合操作的输出可以用某种语言转换为数组并计算内容,但管道输出可能有可能超过16Mb的限制.此外,执行相同的查询只是为了获得计数似乎是浪费.

那么获取文件结果并同时计算可能吗?任何帮助表示赞赏.

Chi*_*ang 32

  1. 使用$project保存tagcounttmp
  2. 使用$pushaddToSet存储tmpdata列表中.

码:

db.test.aggregate(
    {$unwind: '$tags'}, 
    {$group:{_id: '$tags', count:{$sum:1}}},
    {$project:{tmp:{tag:'$_id', count:'$count'}}}, 
    {$group:{_id:null, total:{$sum:1}, data:{$addToSet:'$tmp'}}}
)
Run Code Online (Sandbox Code Playgroud)

输出:

{
    "result" : [
            {
                    "_id" : null,
                    "total" : 5,
                    "data" : [
                            {
                                    "tag" : "SOME",
                                    "count" : 1
                            },
                            {
                                    "tag" : "RANDOM",
                                    "count" : 2
                            },
                            {
                                    "tag" : "TAGS1",
                                    "count" : 1
                            },
                            {
                                    "tag" : "TAGS",
                                    "count" : 1
                            },
                            {
                                    "tag" : "SOME1",
                                    "count" : 1
                            }
                      ]
              }
      ],
      "ok" : 1
}
Run Code Online (Sandbox Code Playgroud)

  • 是否可以使用此方法$ sort,$ skip或$限制数据?你不能在$ project之前限制数据,在没有丢失'total'之后我没有办法做到这一点.此外,{$ sort:{'data.count':1}}似乎不像通常在非聚合查询中那样工作. (2认同)