Airflow网络服务器也启动worker

skw*_*kie 2 airflow

问:为什么airflow webserver还要启动worker?

我一直在谷歌上搜索如何构建 Airflow 服务,因为我需要构建一些环境(最后一个是 Prod)。我发现了一个很棒的博客,其中说不同的角色可以以不同的方式开始,以满足我的需求,例如:

$ airflow webserver
$ airflow scheduler
$ airflow worker
Run Code Online (Sandbox Code Playgroud)

但后来我意识到这airflow webserver也启动了工作人员,我还在配置文件中找到了以下参数:

# Number of workers to run the Gunicorn web server
workers = 4
Run Code Online (Sandbox Code Playgroud)

我的猜测是这 4 个工作线程仅用于运行 Web 服务器,但不运行任务。那是对的吗?

非常感谢。

cwu*_*rtz 5

正确,该设置适用于网络服务器的网络工作人员。Gunicorn 是 HTTP 服务器。网络服务器永远不会真正运行任务。它总是通过进程运行airflow worker(或者如果您使用 LocalExecutor,调度程序将运行它们)