数据仓库和Django

3 django postgresql data-warehouse

这本身就是一个建筑问题,而不是技术问题.

我目前正在构建一个商业网站/社交网络,需要存储大量数据并使用该数据来绘制分析(消费者行为).

我正在使用Django和PostgreSQL数据库.

现在我的问题是:我想扩展这个架构以包含一个数据仓库.理想情况是:操作数据库将是当前的Django PostgreSQL数据库,数据仓库将是额外的,最好是在多维模型中.

我们还处于一个非常早期的阶段,我们将测试50个用户,所以一些原始的东西,如启动器的单列表就足够了.

我想知道是否有人在这种情况下有经验,并且可以建议我创建数据仓库的框架,同时使用Django模型维护操作数据库以便于使用(如果可能).

先感谢您!

C. *_*yer 6

以下是我最近使用的一些很酷的开源工具:

  • Kettle - 优秀的ETL工具,您可以使用它将操作数据库中的数据提取到仓库中.支持任何带有JDBC驱动程序的数据库,并且可以非常轻松地构建例如星型模式.
  • Saiku - 在Pentaho Mondrian(MDX实现)上构建的不错的Web 2.0前端.这允许您的用户轻松构建复杂的聚合查询(在Excel中考虑Pivot表),并且Mondrian层提供缓存等以使事情变得快速.试试这里的演示.