开源ETL框架

jch*_*s12 9 ruby python java perl etl

我被要求对两个ETL框架进行原型设计.要求如下:

  • 开源
  • 适用于Linux
  • 保持
  • 可以在Web浏览器上查看日志(很高兴)
  • 用Perl,Python,Ruby或Java编写

原始文件可以是任何东西(excel,csv,html页面等).目标数据库是MySQL.

不要只是删除名称,请根据您的经验说明优缺点.

谢谢!

Hus*_*ala 6

最流行的基于Java的ETL之一是Talend.

Jaspersoft ETL是另一个从Talend扩展而来的,它有一个很好的基于eclipse的UI.


edg*_*tor 4

我用过水壶。它有自己的 GUI,但如果您更愿意使用 API 自己进行 ETL,它也受支持。事实证明它对我来说非常有用,并且已经有一些可用的插件。