小编Ale*_*sov的帖子

气流回填和新冲刺运行

我有一个DAG,从2015年1月1日到今天,每天都有“ DAG运行”。DAG中的任务不是“过去依赖”的,这意味着在回填期间它们可以按任何日期顺序执行。

如果需要在DAG中回填任务,请使用UI清除所有任务实例(从今天到过去),然后所有DAG运行都会切换到“正在运行”状态,并且该任务将从2015年1月1日开始回填到今天。任务很耗时,因此即使由多个线程/工作人员并行执行,回填也只能在几天内完成。

问题是调度程序在回填完成之前不会为明天,后天等添加新的“ DAG运行”,因此我们无法按时计算新天的数据。有什么方法可以在新任务出现时对它们进行优先级排序,并在新任务完成后继续回填?

PS回填也可以使用“气流回填” CLI完成,但是这种方法有其自身的问题,因此目前我对上述回填技术很感兴趣。

python scheduled-tasks airflow

7
推荐指数
1
解决办法
1193
查看次数

标签 统计

airflow ×1

python ×1

scheduled-tasks ×1