小编Bee*_*157的帖子

大维度周期快照事实表

我被要求对星图进行建模。
我有3个维度:

  1. 日期(日、月、年、周、季度...)
  2. 地点(500 个不同值)
  3. 产品(80k 种不同产品)

主要问题是一天结束时每个地方存储了多少物品(产品)。

经过一些有关维度建模的学习时间。我想我应该实现一个定期快照表。然而,通过阅读 Kimball 文档,我注意到定期快照需要为每个维度组合提供一个条目。这意味着我应该每天添加40M行 (80k*500)。
知道产品(真正的)移动缓慢,并且许多地方长期存储零产品,这听起来像是一种极端的杀伤力。
仅供参考,三年后源数据库中的事务为 150k 行。

那么我真的应该每天添加 40M 行,还是可以只添加指定产品的非空商店?另外,如果出于某种原因有一天所有商店都空了,我是否应该在当天进行输入(商店和产品的尺寸不适用)?

snapshot data-warehouse dimensional-modeling

5
推荐指数
1
解决办法
3547
查看次数