数据仓库暂存区域内的结构

Nee*_*ack 15 sql database-design data-warehouse

我们正在为一家银行开发一个数据仓库,并且几乎遵循标准的Kimball模式的临时表,星型模式和ETL来提取数据.

Kimball谈到了使用暂存区域进行导入,清理,处理等所有内容,直到您准备好将数据放入星型模式.在实践中,这通常意味着将来自源的数据上载到一组表中,几乎没有修改,然后通过中间表可选地获取数据,直到它准备好进入星型模式.对于单个实体来说,这是一项很多工作,这里没有任何一项责任.

我以前使用过的系统已经对不同的表集进行了区分,其程度如下:

  • 上传表格:原始源系统数据,未经修改
  • 登台表:中间处理,打字和清理
  • 仓库表

您可以将它们放在单独的模式中,然后对归档/备份/安全性等应用不同的策略.其他人之一已经在仓库中工作,其中有StagingInputStagingOutput,类似的故事.整个团队拥有丰富的经验,包括数据仓库和其他方面.

然而,尽管如此,通过浏览Kimball和网络,似乎绝对没有任何关于向登台数据库提供任何类型结构的文章.可以原谅的是,相信Kimball先生会让我们所有人都在努力进行这个非常深层次的非结构化数据库.

当然,如果我们想要在临时区域添加更多结构,那么如何去实现它是非常明显的,似乎很奇怪似乎没有任何关于它的文字.

那么,其他人在做什么呢?正在上演这个非常庞大的非结构化混乱,还是民间有一些有趣的设计呢?

Chr*_*ris 4

我也遇到过同样的问题。我们有一个大型人力资源数据仓库,我正在从整个企业的系统中提取数据。我有一个很好的事实和维度表集合,但暂存区域很乱。我不知道这个设计有什么标准。我会遵循您所走的同样的道路,并提出一套标准的名称来保持秩序。你的建议对于命名来说非常好。我会继续努力。