Era*_*rel 7 mysql hadoop etl hive spring-batch
我正在考虑更换一堆Python ETL脚本,这些脚本执行大量数据的夜间/小时数据汇总和统计数据收集.
我想要实现的是
当前脚本执行以下操作:
我的想法是用spring-batch替换脚本.我也研究过Scriptella,但我认为这种情况太简单了.
因为我在Spring-Batch上看到了一些不好的共鸣(大多是老帖子),我希望在这里得到一些输入.我还没有看到很多关于spring-batch和Hive集成,这很麻烦.
如果您想留在 Hadoop 生态系统中,我强烈建议您使用Oozie来自动化您的工作流程。我们 (Cloudera) 提供了Oozie 的打包版本,您可以使用它来开始使用。请参阅我们最近的博客文章了解更多详细信息。
归档时间: |
|
查看次数: |
5401 次 |
最近记录: |