cha*_*111 10 database olap hadoop hbase olap-cube
我有一个应用程序需要针对不同级别的聚合进行分析,这就是OLAP工作负载.我也想经常更新我的数据库.
例如,这是我的更新看起来像(架构看起来像:时间,目标,源IP,浏览器 - >访问)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
Run Code Online (Sandbox Code Playgroud)
然后我想问一下上个月从firefox浏览器访问www.stackoverflow.com的访问量是多少.
我知道Vertica系统可以以相对便宜的方式实现这一点(明智的性能和可扩展性,但可能不是成本方面的).我这里有两个问题.
1)是否有可以构建的开源产品来解决这个问题?特别是,蒙德里安系统的运作情况如何?(可扩展性和性能)2)是否有HBase或Hypertable基础解决方案(显然,裸HBase/Hypertable不能这样做)? - 但如果有基于HBase/Hypertable的项目,可扩展性可能不会成为IMO的问题)?
谢谢!
小智 2
您可以下载greenplum数据库的免费版本(单节点版本)。我自己没有尝试过,但我认为/猜测它是一个强大的野兽。阅读此处:http ://www.dbms2.com/2009/10/19/greenplum-free-single-node-edition/
另一个选择是 MongoDB,它快速且免费,您可以使用 JavaScript 编写 MapReduce 函数来进行分析。
我在这里的声誉太低,无法添加 mongodb 的超链接,所以你必须 google 。我只能为每个帖子添加一个超链接。
归档时间: |
|
查看次数: |
3628 次 |
最近记录: |