Arg*_*ist 11 sql data-warehouse fact-table datahistory
我的数据仓库中有一些实体:
人 - 具有属性personId,dateFrom,dateTo和其他可以更改的人,例如姓氏,出生日期等 - 慢慢变化的维度
文档 - documentId,数字,类型
地址 - addressId,city,street,house,flat
(人与文件)之间的关系是一对多,(人与地址)是多对多的.
我的目标是创建历史事实表,可以回答以下问题:
2,居民的定义地址在规定的时间间隔内有什么历史?
这不仅适用于DW的设计,但我认为这是DW设计中最难的事情.
例如,布朗小姐的personId = 1,自01/01/2005至02/02/2010以来,documentId = 1且documentId = 2的文档已经存在于addressId = 1的地址,然后移至addressId = 2从2010年2月2日开始生活到当前日期(NULL?).但她自2006年5月4日起将姓氏改为格林夫人,自2007年7月6日起,她的第一份文件记录为documentId = 1至documentId = 3.带有personId = 2的Black先生,自2010年2月2日至今日,documentId = 4一直存在于addressId = 1.
对于问题2的查询的预期结果,其中addressId = 1,时间间隔是从01/01/2000到现在,必须如下:
行:
last_name="Brown", documentId=1, dateFrom=01/01/2005, dateTo=04/04/2006
last_name="Brown", documentId=2, dateFrom=01/01/2005, dateTo=04/04/2006
last_name="Green", documentId=1, dateFrom=04/05/2006, dateTo=06/06/2007
last_name="Green", documentId=2, dateFrom=04/05/2006, dateTo=06/06/2007
last_name="Green", documentId=2, dateFrom=06/07/2007, dateTo=02/01/2010
last_name="Green", documentId=3, dateFrom=06/07/2007, dateTo=02/01/2010
last_name="Black", documentId=4, dateFrom=02/03/2010, dateTo=NULL
Run Code Online (Sandbox Code Playgroud)
我有一个想法,用复合键(personId,documentId,addressId,dateFrom)创建事实表,但我不知道如何加载此表,然后使用此结构获得预期的结果.
我会很高兴得到任何帮助!
有趣的问题@Argnist!
因此,要为我的示例创建一些通用语言,您需要
一位同事写了一篇关于使用两个代理键的简短博客来解释上述暗淡“在维度上使用两个代理键”。
我总是会以 yyyymmdd 的形式将带有 PK 的 DimDate 添加到具有额外属性列的任何数据仓库中。
那么你的事实表将是
然后加入“kc”即可显示当前的人员/文档/地址维度信息。如果您加入“k”,您可以显示历史人员/文档/地址维度信息。
这样做的缺点是,该事实表需要为每个人/文档/地址/日期组合占据一行。但它确实是一个非常狭窄的表,因为该表只有一些外键。
这样做的优点是很容易查询您所问的各种问题。
或者,您可以将事实表设置为
这显然更加紧凑,但查询变得更加复杂。您还可以在事实表上放置一个视图,以便于查询!
解决方案的选择取决于数据更改的频率。我怀疑它不会那么快改变,所以事实表的替代设计可能会更好。
希望有帮助。
| 归档时间: |
|
| 查看次数: |
3817 次 |
| 最近记录: |