MongoDB - 查询过去几小时内创建的所有文档,并按分钟分组?

Whn*_*ife 5 mongodb

通过阅读各种文章,我相信这应该是可能的,但我不确定从哪里开始。

这就是我想要做的:

我想运行一个查询,它在过去一小时内找到所有文档 createAt,并按分钟对所有文档进行分组,并且由于每个文档都有一个推文值,例如 5、6 或 19,因此将它们加起来这些分钟,并提供了一个总和。

以下是该集合的示例:

{
  "createdAt": { "$date": 1385064947832 },
  "updatedAt": null,
  "tweets": 47,
  "id": "06E72EBD-D6F4-42B6-B79B-DB700CCD4E3F",
  "_id": "06E72EBD-D6F4-42B6-B79B-DB700CCD4E3F"
}
Run Code Online (Sandbox Code Playgroud)

这可以在 mongodb 中做到吗?

@zero323 - 我首先尝试像这样对最后一个小时进行分组:

db.tweetdatas.group( {
   key: { tweets: 1, 'createdAt': 1 },
   cond: { createdAt: { $gt: new Date("2013-11-20T19:44:58.435Z"), $lt: new Date("2013-11-20T20:44:58.435Z") } },
   reduce: function ( curr, result ) { },
   initial: { }
} )
Run Code Online (Sandbox Code Playgroud)

但这只是返回时间范围内的所有推文,这在技术上是我想要的,但现在我想按每分钟对它们进行分组,并将每分钟的推文总和相加。

@almypal

根据您的建议,这是我正在使用的查询:

db.tweetdatas.aggregate(
    {$match:{ "createdAt":{$gt: "2013-11-22T14:59:18.748Z"}, }},
    {$project: { "createdAt":1, "createdAt_Minutes": { $minute : "$createdAt" }, "tweets":1, }},
    {$group:{ "_id":"$createdAt_Minutes", "sum_tweets":{$sum:"$tweets"} }}
)
Run Code Online (Sandbox Code Playgroud)

但是,它显示此响应:

{ "result" : [ ], "ok" : 1 }
Run Code Online (Sandbox Code Playgroud)

更新:@almypal的回复有效。显然,像我在上面的例子中那样输入日期是行不通的。当我从 Node 运行此查询时,在 shell 中,我认为将 var 日期转换为字符串并在 shell 中使用它会更容易。

alm*_*pal 5

使用聚合如下:

  var lastHour = new Date();
  lastHour.setHours(lastHour.getHours()-1);

  db.tweetdatas.aggregate(
    {$match:{ "createdAt":{$gt: lastHour}, }},
    {$project: { "createdAt":1, "createdAt_Minutes": { $minute : "$createdAt" }, "tweets":1, }},
    {$group:{ "_id":"$createdAt_Minutes", "sum_tweets":{$sum:"$tweets"} }}
  )    
Run Code Online (Sandbox Code Playgroud)

结果是这样的

 {
    "result" : [
    {
        "_id" : 1,
        "sum_tweets" : 117
    },
    {
        "_id" : 2,
        "sum_tweets" : 40
    },
    {
        "_id" : 3,
        "sum_tweets" : 73
    }
],
"ok" : 1
 }
Run Code Online (Sandbox Code Playgroud)

其中 _id 对应于特定分钟,而 sum_tweets 是该分钟内的推文总数。