为什么数据仓库时间依赖?

Nip*_*mba 1 data-warehouse

在我的教科书中,它说数据仓库中的数据只在一段时间内有效,换句话说,它被认为是时间相关的,但根据数据仓库的四个特性,非易失性表示一旦数据已经进入数据仓库,不能不惜一切代价更改。

那么,数据仓库是否还有其他属性可以说明数据仓库是时间相关的?

Ron*_*unn 5

您的教科书上有没有说“时间相关”或“时间变量”?它可能是对 Bill Inmon 的定义的转述,即数据仓库是面向主题的、集成的、时变的和非易失性的。

“时间变量”是指数据仓库完全包含在一个时间段内。另一种说法是,DW 在一个时期内是一致的,这意味着数据仓库每天、每小时或以其他一些周期为基础加载,并且在该时期内不会发生变化。

请记住,这些要求是在 1992 年编写的,在大约 25 年后,当实时数据仓库成为现实时,它们有点难以支持,并且数据仓库可能每秒更改几次。

另外,请注意“非易失性”的定义。有些人将其解释为数据永远不会改变,但这又是一个过时的概念。显示订单预测发货日期的累积快照事实表可能会在订单生命周期内多次更新。当然,这取决于事实的目的——如果要衡量预测日期的波动性,我们会保留每一个更改,但如果要衡量订单在其生命周期中的流量,我们只需更新它.

就个人而言,我更喜欢 Ralph Kimball 的定义,“数据仓库是专门为查询和分析而构建的交易数据的副本。” 更加清晰和切中要害。