Apache Airflow 1.9.0中的min_file_process_interval和dag_dir_list_interval有什么区别?

Mas*_*syB 5 airflow

我们正在使用Airflow v 1.9.0。我们有100多个dag,实例速度非常慢。调度程序仅启动一些任务。

为了减少CPU使用量,我们想调整一些配置参数,即:min_file_process_intervaldag_dir_list_interval。该文件并没有真正明确了两者的区别

tob*_*bi6 9

min_file_process_interval

在只有少量DAG定义文件的情况下,循环可能会在一分钟内多次处理DAG定义文件。为了控制DAG文件处理的速度,min_file_process_interval可以将设置为较高的值。此参数确保DAG定义文件的处理不超过每次一次min_file_process_interval

dag_dir_list_interval

由于调度程序可以无限期运行,因此有必要定期刷新DAG定义目录中的文件列表。刷新间隔由dag_dir_list_interval配置参数控制。

资料来源:对这两个字词的Google搜索都得出第一个结果https://cwiki.apache.org/confluence/display/AIRFLOW/Scheduler+Basics

  • 如果我错了,请纠正我:调度程序会在每个 `dag_dir_list_interval` 列出 DAG 定义文件,并且每个 `min_file_process_interval` 都会处理这些文件 (3认同)