小编use*_*554的帖子

EDW金博尔vs伊蒙

我的任务是提出有关如何进行EDW的建议,并希望就我所看到的内容进行澄清。我正在学习的所有内容都表明,与Inmon相比,Kimball的方法将更快地为企业带来价值。我发现Kimball的方法是来自getgo的维度模型,并且不同的数据集市(星型架构)通过一致的维度进行集成...因此,理论上讲,我可以简单地提出直接的DM来解决业务需求并从那里继续。

我正在学习的内容表明,Inmon的模型表明我有3NF设计的EDW。EDW不是由源系统定义的,而是由业务结构,公司工厂(订单,HR等)定义的。因此,来自不同系统的数据会映射到此结构中。数据采用这种形式后,便会创建ETL以生成DM。

我个人认为Inmon的方法是更好的方法。我相信这种方式将确保数据保持一致,并且感觉您可以对这些数据做更多的事情。尽管我正在阅读的所有内容都说,交付某些内容将花费更多的时间,但我不知道这是怎么回事,这使我无法采用这种方法。从我的狭narrow角度来看,无论最终结果是什么,我们都需要DM。无论使用Kimball还是Inmon的方法,最终结果都是相同的。

那么问题就变成了我们如何到达那里?在Kimballs方法中,我们将在某些暂存位置创建ETL,通常从那里创建DM。在Inmon的方法中,我觉得我们只需要添加另一层...就是从暂存区域将数据加载到按功能组织的3NF另一个数据库中。我所缺少的是此步骤如何增加这么多时间。

我觉得我可以看看需要制作的最终DM。将它们映射回3NF中的DW,然后随着请求更多的DM继续使用越来越多的数据构建3NF中的DW。但是,如果我在Kimballs模型中创建DM,则DM将围绕为该DM确定的谷物水平构建,并且如果下一个DM要求以更深的谷物进行报告该怎么办(对我来说,Kimballs方法学会花费更多工作),而与Inmon无关紧要。我拥有跨国级别的所有产品,因此需要各种谷物的DM,我也有数据,只需将其ETL传送给DM,由于它们均来自同一数据,因此所有DM都将报告相同的数据。

我不知道...只是在寻找别人的意见。我读到的所有内容都说Kimball的速度更快...我可以肯定地说,但是走更快的路线肯定会带来成本。而且为了争辩……假设要花一个星期的时间来完成DM并通过Kimballs方法进行运行……对我来说,感觉使用Inmon的方法只需要10%或20%的时间。

如果有人对不同模型有任何现实世界的经验,并且如果一个人花费的时间那么长,那么另一个人……请分享。或者,如果我有这个问题,那么也告诉我!

data-warehouse

4
推荐指数
2
解决办法
620
查看次数

标签 统计

data-warehouse ×1