我想知道自动提取、转换和加载数据的非正式方法是否构成“ETL”。例如,我编写 Excel VBA 代码以从数据库中提取到电子表格中,将数据转换为所需的格式,然后通过将 Excel 文件移动到正确的文件夹来加载。将其展示为简历的 ETL 是否不正确?对此有术语或行话吗?
小智 1
ETL 不是一种工具,而是用于从源系统到目标系统(通常是数据仓库)的数据集成的过程或过程组。
因此,如果您正在对转换后的数据进行提取、转换和进一步加载,那么您实际上正在执行ETL。有人可能会说它更难维护,而且更容易出错。他们是对的。但糟糕的代码不会将其转换为与代码不同的东西。同样适用。
棘手的部分是最终的加载过程,即在文件系统中移动 Excel 文件。我们在工作中使用由独立文件组成的基于 MapR FS 的 MapR DB,是的,我们进行数据集成,最终将这些文件“加载”到最终目的地,尽管它们实际上只是文件。最后它们由查询引擎访问。所以在今天我会认为它是一个异构数据库,而你的系统是一个 ETL。不明白为什么不。
https://en.wikipedia.org/wiki/Extract,_transform,_load
归档时间: |
|
查看次数: |
2236 次 |
最近记录: |