在 BranchPython Operator 之后,Airflow 2.0 任务被跳过

ABa*_*ron 3 python branch etl directed-acyclic-graphs airflow

我正在新版本中的 Airflow 中摆弄分支,无论我尝试什么,BranchOperator 之后的所有任务都会被跳过。

这是我一直在努力完成的一个最小的例子

from airflow.decorators import dag, task
from datetime import timedelta, datetime

from airflow.operators.python import BranchPythonOperator
from airflow.utils.trigger_rule import TriggerRule

import logging
logger = logging.getLogger("airflow.task")

@dag(
    schedule_interval="0 0 * * *",
    start_date=datetime.today() - timedelta(days=2),
    dagrun_timeout=timedelta(minutes=60),
)
def StackOverflowExample():

    @task
    def task_A():

        logging.info("TASK A")
        

    @task
    def task_B():

        logging.info("TASK B")

    @task
    def task_C():

        logging.info("TASK C")

    @task
    def task_D():
        
        logging.info("TASK D")

        return {"parameter":0.5}

    
    def _choose_task(task_parameters,**kwargs):

        logging.info(task_parameters["parameter"])
        if task_parameters["parameter"]<0.5:
            logging.info("SUCCESSS ")
            return ['branch_1', 'task_final']
        else:
            logging.info("RIP")
            return ['branch_2', 'task_final']

    @task(task_id="branch_1")
    def branch_1():
        logging.info("branch_1...")

    @task(task_id="branch_2")
    def branch_2():
        logging.info("branch_2")

    @task(task_id="task_final")
    def task_final():
        logging.info("task_final")


    parameter = task_A() >> task_B() >> task_C() >> task_D()   

    choose_task = BranchPythonOperator(
                                            task_id='choose_best_model',
                                            op_kwargs={"task_parameters":parameter},
                                            python_callable=_choose_task,
                                            trigger_rule=TriggerRule.NONE_FAILED_MIN_ONE_SUCCESS
                                            )



    choose_task >> [branch_1(), branch_2()] >> task_final()


dag = StackOverflowExample  ()
Run Code Online (Sandbox Code Playgroud)

气流 DAG 图

有什么线索吗?我对触发规则表示怀疑。我是 Airflow 初学者,所以我不会放弃我忽略的任何其他问题

Ela*_*lad 6

您应该将触发规则设置为task_final。您希望在其执行完成后task_final执行(无论执行/跳过其中哪一个),因此您需要设置所有完成触发规则:branch_1branch_2

@task(task_id="task_final", trigger_rule=TriggerRule.ALL_DONE)
def task_final():
    logging.info("task_final")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

  • @ABaron因为trigger_rule的默认值是ALL_SUCCESS,这对于其他规则来说是可以的。task_final 是工作流程中唯一依赖于 2 个任务的任务,其中一个任务肯定会被跳过 (3认同)