如何用php计算mongo集合中的文档元素?

Ale*_*u R 2 mongodb nosql mongodb-query

我有一个mongo文件的以下结构:

{
 "_id": ObjectId("4fba2558a0787e53320027eb"),
 "replies": {
    "0": {
      "email": ObjectId("4fb89a181b3129fe2d000000"),
      "sentDate": "2012-05-21T11: 22: 01.418Z" 
    } 
    "1": {
     "email": ObjectId("4fb89a181b3129fe2d000000"),
     "sentDate": "2012-05-21T11: 22: 01.418Z" 
    } 
    "2" ....
 }

}
Run Code Online (Sandbox Code Playgroud)

如何计算集合中所有文档的所有回复?谢谢!

jmi*_*ola 5

在下面的答案中,我正在处理一个简单的数据集,其中包含五个回复:

> db.foo.find()
{ "_id" : ObjectId("4fba6b0c7c32e336fc6fd7d2"), "replies" : [ 1, 2, 3 ] }
{ "_id" : ObjectId("4fba6b157c32e336fc6fd7d3"), "replies" : [ 1, 2 ] }
Run Code Online (Sandbox Code Playgroud)

由于我们不是简单地计算文档,db.collection.count()在这里不会帮助我们.我们需要使用MapReduce扫描每个文档并聚合回复数组长度.考虑以下:

db.foo.mapReduce(
    function() { emit('totalReplies', { count: this.replies.length }); },
    function(key, values) {
        var result = { count: 0 };
        values.forEach(function(value) {
            result.count += value.count;
        });
        return result;
    },
    { out: { inline: 1 }}
);
Run Code Online (Sandbox Code Playgroud)

map函数(第一个参数)在整个集合中运行,并在常量键下发出每个文档中的回复数.然后,Mongo会考虑所有发出的值并多次运行reduce函数(第二个参数)来合并(字面上减少)结果.希望这里的代码很简单.如果你是map/reduce的新手,有一点需要注意,reduce方法必须能够处理自己的输出.这在上面链接的MapReduce文档中有详细解释.

注意:如果您的集合非常大,您可能必须使用其他输出模式(例如集合输出); 但是,inline适用于小型数据集.

最后,如果您正在使用MongoDB 2.1+,我们可以利用聚合框架来避免编写JS函数并使其更容易:

db.foo.aggregate(
    { $project: { replies: 1 }},
    { $unwind: "$replies" },
    { $group: {
        _id: "result",
        totalReplies: { $sum: 1 }
    }}
);
Run Code Online (Sandbox Code Playgroud)

这里发生了三件事.首先,我们告诉Mongo我们对该replies领域感兴趣.其次,我们想要展开数组,以便我们可以遍历投影中的所有元素.最后,我们将在"结果"桶(任何常量都可以)1下计算totalReplies结果,并为每次迭代添加结果.执行此查询将产生以下结果:

{
    "result" : [{
        "_id" : "result",
        "totalReplies" : 5
    }],
    "ok" : 1
}
Run Code Online (Sandbox Code Playgroud)

虽然我写了关于Mongo客户端的上述答案,但你应该毫不费力地将它们翻译成PHP.您需要使用MongoDB :: command()来运行MapReduce或聚合查询,因为PHP驱动程序当前没有任何辅助方法.目前PHP文档中有一个MapReduce示例,您可以通过相同的方法引用此Google组帖子来执行聚合查询.