Lan*_*ard 7 ruby-on-rails real-time mongodb
在探索使用MongoDB进行实时分析的方法时,似乎有一种相当标准的方法来进行求和,但在更复杂的聚合方面却没有.一些有帮助的事情......
执行求和的基本方法是以原子方式递增每个新记录的文档键,以缓存常见查询:
Stats.collection.update({"keys" => ["a", "b", "c"]}, {"$inc" => {"counter_1" => 1, "counter_2" => 1"}, "upsert" => true);
Run Code Online (Sandbox Code Playgroud)
但这不适用于总和以外的聚合.我的问题是,对于mongodb中的平均值,分钟数和最大值,可以这样做吗?
假设您有这样的文档:
{
:date => "04/27/2011",
:page_views => 1000,
:user_birthdays => ["12/10/1980", "6/22/1971", ...] # 1000 total
}
Run Code Online (Sandbox Code Playgroud)
你能做一些原型或优化/实时操作,将生日分组成这样的东西吗?
{
:date => "04/27/2011",
:page_views => 1000,
:user_birthdays => ["12/10/1980", "6/22/1971", ...], # 1000 total
:average_age => 27.8,
:age_rank => {
"0 to 20" => 180,
"20 to 30" => 720,
"30 to 40" => 100,
"40 to 50" => 0
}
}
Run Code Online (Sandbox Code Playgroud)
...就像你可以做Doc.collection.update({x => 1}, {"$push" => {"user_birthdays" => "12/10/1980"}})一些东西添加到数组,而不必加载文档,你可以做这样的事情来平均/聚合数组吗?这些行中是否有用于实时聚合的内容?
MapReduce用于在批处理作业中执行此操作,我正在寻找类似于实时map-reduce的模式:
你能做一些原型或优化/实时操作,将生日分组成这样的东西吗?
看起来你已经添加了两个领域age_rank,average_age.这些是基于您已有数据的有效计算字段.如果我给你带有页面浏览量和用户生日的文档,那么客户端代码找到最小值/最大值,平均值等应该是非常简单的.
在我看来,你要求MongoDB为你的服务器端执行聚合.但是你添加了你不想使用Map/Reduce的限制吗?
如果我正确理解你的问题,那么你正在寻找一些可以说"将这个项目添加到一个数组并让所有依赖项目自行更新"的东西?你不希望读者执行任何逻辑,你希望一切都在服务器端"神奇地"发生.
因此,有三种不同的方法可以解决这个问题,但目前只有其中一种可用:
不幸的是,你现在唯一的选择是#1.幸运的是,我知道有几个人成功使用选项#1.
即将推出的 1.9.x 不稳定版本已计划进行工作,该版本可能具有聚合功能。
请参阅: https: //jira.mongodb.org/browse/SERVER-447
当然,它可能会得到更新的版本/
| 归档时间: |
|
| 查看次数: |
1790 次 |
| 最近记录: |