Lif*_*H2O 10 data-warehouse terminology distributed-databases
我找不到任何明确的定义或解释。两者似乎都是去中心化的。看起来在 Federated DWH 中,数据是分布式的,没有集成到单个存储库中,也没有从分布式源访问。
在分散式 DWH 实施中,数据被集成到一个中央存储库中。
请解释这两种实现之间的区别。
去中心化数据仓库本质上是由各个区域或业务部门维护但集中提供的数据仓库的集合。它们可能位于同一台物理服务器上,共享报告工具,或者以某种其他方式在整个组织中可用。可能还有集中式组件,例如主数据管理。这样做通常是因为集中式数据仓库超出一定规模的组织会变得笨拙。数据仓库必须对变化做出响应,如果响应太迟钝,那么各个部门将开始构建自己的解决方案。
您可以在投资银行中看到这一点,其中倾向于使用数据仓库来满足特定要求(例如特定的监管计划或某种类型的财务报告),而不是在整个业务中建立一个集中的仓库。一家大型银行规模的公司过于复杂,无法在合理的时间内满足完全集中的 EDW 的要求。
联合数据仓库在分散的数据仓库中添加了一个主整合层。通常,这只会容纳数据的一个狭窄的垂直切片,因为其目的是整合整个业务中的关键指标,用于公司或集团级别的报告,而不是为所有部门提供通用的 MI 平台。各部门需要自行开发 EDW 或 MI 系统,但需要提供填充中央整合层所需的数据集。
这种架构为您提供了两全其美的优势。中央管理人员可以在整个组织中查看他们的指标,部门可以安排 MI 解决方案以满足他们的需求。中央管理只需要将其分析和 MI 所需的数据要求强加为部门系统提供的提要。如果他们需要对特定部门进行更深入的报告或分析,则可以由部门系统提供。
下面链接的文章更深入地讨论了联合数据仓库。
http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/
本文更深入地讨论数据仓库拓扑。
https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1
https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2