小编sfa*_*tor的帖子

如何构建分析型 BI 平台?

我正在为一家中型公司开发一个新的 BI 项目。目前还没有分析基础设施,报告是在 Excel 中手动完成的。有几个不同的数据源(来自不同的系统,如 Billing)需要集成来执行报告和分析。其中一些是数据转储,需要一些自定义转换才能进入数据库就绪形式。这些有大量的列。这些需要处理,所需的列过滤和聚合完成等。通常每天产生大约 50 GB 的数据,并且每天将插入到现有表中。

我们发现像 Vertica 这样的分析数据库值得研究。我们之前没有使用非 OLTP 数据库的任何经验。我的理解是 Vertica(和其他类似的)是读取优化的,非常适合分析任务。我的问题是在加载和处理原始数据的初始阶段如何公平?我们是否应该使用像 Oracle 这样的传统 OLTP 数据库,然后将 Vertica 用于星型模式、维度建模类型的数据存储?Vertica 是否适合 ETL 场景?

这种场景的典型架构如何?

data-warehouse database-design database-recommendation architecture vertica

1
推荐指数
1
解决办法
767
查看次数