我需要管理ETL任务的大型工作流程,其执行取决于时间,数据可用性或外部事件.在执行工作流程期间,某些作业可能会失败,并且系统应该能够重新启动失败的工作流程分支,而无需等待整个工作流程完成执行.
python中有没有可以处理这个的框架?
我看到几个核心功能:
像Oozie这样的东西,但更通用的目的和python.
python etl scheduling directed-acyclic-graphs oozie
directed-acyclic-graphs ×1
etl ×1
oozie ×1
python ×1
scheduling ×1