Datavault - 硬规则 (rawvault) 与软规则 (businessvault)

pet*_*dis 3 data-vault

我有一个关于硬规则(rawVault)和软规则(业务规则)的问题。

\n\n

我的例子是一个源系统有一个名为 Pets 的非规范化表,其中 Pets 包含猫、狗和鸟,它们通过类型代码进行区分(1 \xe2\x80\x93 cat,2 \xe2\x80\x93 dogs, 3 \xe2\x80\x93 鸟)。

\n\n

我的问题是关于将数据加载到 Rawvault 与 Business Vault 时的硬规则与软规则。加载Pets表时,您可以在rawvault中创建h_cat、h_dog和h_bird集线器,并根据类型代码1过滤源表pets到h_cat,类型代码2到h_dog,类型代码3到h_bird吗?这是硬规则还是软规则?

\n\n

或者

\n\n

当基于类型代码过滤数据时,我们是否应该在 rawvault 中创建 h_pet 中心,使数据尽可能接近源,在 Businessvault 中创建 h_cat、h_dog 和 h_bird,因为这将被归类为软规则?

\n

Kar*_*rri 6

在您的情况下,您将拥有一个针对所有三种动物类型的中心。任何更改数据的逻辑都会添加到原始保管库之后。

这是软规则和硬规则之间的一个很好的区别:

硬性规定

这些应该在数据存储到 DataVault 之前应用。此处应用的任何规则都不会更改数据的内容或粒度,并保持可审核性。

  • 数据输入
  • 规范化/反规范化
  • 添加系统字段(标签)
  • 重复数据删除
  • 按记录结构拆分
  • 修剪字符串中的空格

软规则

例如,更改或解释数据的规则添加业务逻辑。这改变了数据的粒度。

  • 连接名称字段
  • 标准化地址
  • 计算每月销售额
  • 聚结
  • 合并