关于在数据集市中填充事实表的想法

bkm*_*bkm 1 database database-design etl data-warehouse

我正在寻找填充数据集市中的事实表的想法.可以说我有以下几个方面

  1. 医师
  2. 患者
  3. 日期
  4. geo_location
  5. patient_demography
  6. 测试

我使用了两个ETL工具来填充维度表 - Pentaho和Oracle Warehouse Builder.日期,患者人口统计和地理位置不会从运营商店中提取数据.所有维度表都有自己的新代理键.

我现在想要在患者访问的详细信息中填写事实表.当患者在特定日期拜访医生时,他会下令进行测试.这是事实表中的信息.还有其他措施,我为了简单而省略.

我可以使用源系统中的事实表中的所有必需列创建单个连接.但是,我需要存储患者,医师,测试等维度表中的密钥.实现这一目标的最佳方法是什么?

ETL工具可以帮助解决这个问题吗?

谢谢克里希纳

Dam*_*vic 6

每个维度表都应具有唯一标识表行描述的对象(人员,日期,位置)的BusinessKey.在加载事实表期间,您必须根据BusinessKey从维度表中查找PrimaryKey.您可以选择直接查找维度表,或者在加载事实表之前为每个维度创建一个键查找表.

Pentaho Kettle具有"数据库值查找"(转换步骤).您可能还想查看Kimball数据仓库ETL工具包的"交付事实表"部分.