直接Java/Groovy与ETL工具(Talend/etc) - 您将使用哪些库?

Ale*_*x R 11 java groovy etl scala talend

假设您有一个小项目,表面看起来像是Talend之类的ETL工具的良好匹配.

但进一步假设,你从未使用Talend,而且,你不相信"视觉编程"工具,而是宁愿用老式的方式编写所有东西(在一个漂亮的IDE上的文本!),并在适当的语言和支持的帮助下库.

有哪些语言模式和支持库可以帮助您远离ETL工具诱惑/陷阱?

huy*_*hjl 5

这取决于可交付物是处理器还是输出本身.如果您只需要提供输出,则无需维护代码.如果代码需要维护,那么你会维护它还是其他人?

如果有人需要维护我会使用Java或给他们Talend.

如果它是一次性代码,我会使用编程更容易或更有趣的代码.

如果你需要维护它并且处理很复杂,我会使用Scala.它有:

  • 一些库与数据库交互
  • xml文字
  • 解析器组合器
  • 它的集合包中有趣的功能(map,filter,groupBy,partition,...)
  • 当然还有任何其他现有的Java库.


Eri*_*ric 0

根据数据库模式的大小,您可以在 Hibernate 中快速映射所有内容,然后使用生成的对象模型来完成您的工作(取决于您想要 ETL 工具的用途)