ETL工具......他们究竟做了什么?请以外行人的话说

Jav*_*med 6 etl

我最近接触过一些ETL工具,如Talend和Apatar,我想知道这些工具的目的/主要目标到底是什么.谁主要使用它们,如果你使用它们,它们(根据我的理解)比仅仅编写某种类型的脚本更好.

duf*_*ymo 14

ETL代表"提取/转换/加载".这些工具从一个来源获取数据并将其移动到另一个来源.您可以以独特的方式将模式从源映射到目标,在数据移动到目标之前转换和清理数据,并以有效的方式加载目标.您可以将ETL作业计划为批处理.

这些数据源可以是关系数据库,电子表格,XML文件等.


谁"使用"他们?取决于"使用"的含义.它们只是代码而且大部分时间都被安排为常规操作的一部分.没有最终用户功能.它们完全适合程序员创建和操作.

优于脚本?没有.它们是用特定于域的语言(DSL)编写的脚本,完全集中在从源"提取","转换"和"加载"到目标.脚本的大部分有趣部分是每个阶段的逐字段映射.