Web规模分析应用程序的数据库选择

Yas*_*Umi 7 database olap database-design nosql business-intelligence

我想构建一个类似于Google-Analytics的网络应用程序,我会在其中收集客户最终用户的统计信息,并根据该数据向客户展示分析.

特点:

  • 高扩展性,处理量非常大
  • 分区 - 查询始终在单个客户的数据上运行
  • 支持分析查询(向下钻取,切片等)

由于分析需要,我正在考虑使用OLAP/BI套件,但我不确定它是否适合这种规模.NoSQL数据库?简单的RDBMS会做什么?

Spr*_*dzy 4

这些是我在生产环境中使用的,它的作用就像一个魅力。

我做了三件事

PostgreSQL + LucidDB + Mondrian(更一般地说是整个 Pentaho BI 套件组件)

  • PostgreSQL:我不会描述 postgresql,真正强大的开源 RDBMS 会让你做 - 当然 - 你需要的一切。我用它来存储我的操作数据。

  • LucidDB:LucidDB 是一个开源列存储数据库。高度可扩展,与 PostgreSQL 相比,在检索大量数据时将提供真正的处理时间增益。它没有针对事务处理进行优化,而是针对密集读取进行优化。这是我的数据仓库数据库

  • Mondrian:Mondrian 是一个开源 R-OLAP 多维数据集。LucidDB 可以轻松地将这两个程序连接在一起。

我建议您查看整个 Pentaho BI Suite,它值得,您可能想使用其中的一些组件。

希望我能帮忙,