分期和生产 DWH 之间的区别

STO*_*ORM 3 data-warehouse sql-server

我有一个关于数据仓库架构的一般性问题。我听说过很多 Staging 和 Production,因此应该首先通过 SSIS 将数据加载到 staging dwh,然后通过 SSIS 加载到生产环境。

但是有什么区别吗?我的意思是它只是生产数据仓库的“副本”(在推送到生产之前对数据进行一些质量检查?)还是不同模型或(不同模式)中的源数据的“副本”?

从软件开发的角度来看,我知道两者是相同的,唯一的目的是检查所有利益相关者的软件版本并让发布版本部署到生产环境中。通常在软件情况下,分期与生产是相同的(也许只有硬件大小不同)。

Wor*_*DBA 10

我认为这是同一个词被用来描述两种不同的事物的情况。

第一个是登台环境。正如您所提到的,这是生产环境体系结构的近似副本,可用于测试将进入生产环境的版本或允许用户在发布之前查看即将推出的功能。

第二个是数据暂存区。虽然它被称为登台,但它实际上可以位于生产环境中(就像我工作过的大多数公司的情况一样)。该区域用于在加载到数据仓库之前清理和验证从 OLTP 系统中提取的数据。

一般来说,至少在我的工作经历中,我发现由于法律或后勤限制,生产数据可能无法复制到暂存环境中。大多数情况下,我发现这是因为开发人员/测试人员不应访问敏感数据,例如个人详细信息、信用卡等……但可以将其复制到数据暂存区以准备将其加载到数据仓库中。

随着时间的推移,随着您获得更多经验,您会更容易分辨出一个人所指的是哪一个——但在此之前,请记住,实时数据不应离开生产环境,并且在生产中拥有一个专门的区域是完全没问题的您可以处理您的数据。