开源商业智能/DWH 解决方案

DrC*_*sos 17 tools data-warehouse database-agnostic business-intelligence

我想知道这个问题还没有被问过。谷歌对我来说只有很少的结果没有显示高质量的工具

有哪些用于数据仓库的开源(也可以免费)解决方案,更具体地说是商业智能工具?你和他们有什么经历。我在我的硕士课程中有过一门课程,我们使用 MS 商业智能和 MSSQL 作为数据仓库存储。现在我想通过“开放”的工具深入探讨这个话题。

是否有任何可比较的商业智能工具(主要是独立于数据库的),您是否有使用它们的经验?

编辑玛丽安对斯蒂芬妮的回答的评论,我发现我把这个问题表述错了。我知道 DWH 只是“报告优化”数据库,斯蒂芬妮对此的解释非常清楚。我更感兴趣的是如何使用什么类型的 BI 软件/工具/其他技术将数据转换为这种优化的形式。

Spr*_*dzy 12

我已经与 Pentaho 合作了大约一年。

Pentaho 是一个完整的商业智能开源套件。

它的优势在于它依赖于独立管理的项目:

  • Pentaho 数据集成(Kettle)->ETL
  • Pentaho 报表设计器 (PRD) -> 报表设计器
  • 蒙德里安 -> R-OLAP 立方体
  • 以及更多..

您可以将它们作为一个整体 (Pentaho BI Server) 或分开使用。

我为什么要推荐它?社区非常活跃,每周都会提供插件。一组社区成员提供了一个框架,用于构建带有 click&go ui 的交互式仪表板。

它与数据库无关。如果你有一些空闲时间,就看看它。

我在使用 Pentaho 之前做了一项研究,我确实测试了 IceCube 和 Palo 甚至 JasperSoft,但根据我的需要,Pentaho 的性能要好得多。


小智 6

我认为您没有理解datawarehouse 的含义。它不是工具。或者一个应用程序。或者一个数据库。这并不意味着“大数据库”。

你说,

我们使用 MS 商业智能和 MSSQL 作为数据仓库存储。

MSSQL 不仅仅是 DWH 的存储,它还是DWH。

数据仓库是专门为报告设计和优化的数据库。您不会根据它预订交易。

您几乎可以针对该 DWH 使用任何 BI 工具。但 BI 工具不是 DWH。

可以使用任何 RDBMS。有些人会在管理规模方面做得更好。分区和星形连接是 RDBMS 中的功能示例,它们改进了非常大的数据仓库,但它们不是必需的。

多维数据集通常派生自数据仓库,用于沿各个维度快速对各种级别的聚合进行切片和切块。

使用您想要的任何 RDBMS。理解维度建模才是真正的讨论。