问:为什么airflow webserver还要启动worker?
我一直在谷歌上搜索如何构建 Airflow 服务,因为我需要构建一些环境(最后一个是 Prod)。我发现了一个很棒的博客,其中说不同的角色可以以不同的方式开始,以满足我的需求,例如:
$ airflow webserver
$ airflow scheduler
$ airflow worker
Run Code Online (Sandbox Code Playgroud)
但后来我意识到这airflow webserver也启动了工作人员,我还在配置文件中找到了以下参数:
# Number of workers to run the Gunicorn web server
workers = 4
Run Code Online (Sandbox Code Playgroud)
我的猜测是这 4 个工作线程仅用于运行 Web 服务器,但不运行任务。那是对的吗?
非常感谢。
正确,该设置适用于网络服务器的网络工作人员。Gunicorn 是 HTTP 服务器。网络服务器永远不会真正运行任务。它总是通过进程运行airflow worker(或者如果您使用 LocalExecutor,调度程序将运行它们)
| 归档时间: |
|
| 查看次数: |
1753 次 |
| 最近记录: |