CSY*_*CSY 19 database data-warehouse
来自维基,
数据沿袭被定义为数据生命周期,包括数据的起源以及数据随时间变化的位置.它描述了数据在经历各种流程时会发生什么.它有助于提供对分析管道的可视性,并将跟踪错误简化回源.
数据来源记录了影响感兴趣数据的输入,实体,系统和过程,实际上提供了数据及其来源的历史记录.
似乎这两个概念都在谈论数据的来源,但我仍然对这些差异感到困惑.两个概念是否相同?如果他们不同,有人可以分享一个例子吗?
谢谢,
小智 15
根据我们的经验,数据来源仅包括针对业务用户的高级系统视图,因此他们可以粗略地导航数据来自何处.它由各种建模工具或简单的自定义表格和图表提供.数据沿袭是一个更具体的术语,包括两个方面 - 业务(数据)沿袭和技术(数据)沿袭.业务沿袭图像数据在业务级别上流动,它由Collibra,Alation和许多其他解决方案提供.技术数据沿袭是根据实际技术元数据创建的,并跟踪最低级别的数据流 - 实际表格,脚本和语句.技术数据沿袭由MANTA或Informatica Metadata Manager等解决方案提供.
小智 5
数据来源是,
数据谱系(系谱是什么,其旅程的历史,它从哪里开始,它是如何形成的,它是如何随时间变化的,它在哪里,它所经过的系统,任何损失或收益)(即数据面向,元数据)
加
影响数据的输入、实体、系统和过程(即面向过程),可用于复制数据。