Airflow:在下一个任务中获取上一个任务ID

Gag*_*gan 5 airflow

我有 2 个任务。在第一个中,python 运算符计算一些内容,在第二个中,我想在 Http 运算符中使用 python 运算符的输出。这是我的代码:

source_list = ['account', 'sales']

for source_type in source_list:
    t2 = PythonOperator(
                task_id='compute_next_gather_time_for_' + source_type,
                python_callable=compute_next_gather_time,
                provide_context=True,
                trigger_rule=TriggerRule.ALL_SUCCESS,
                op_args=[source_type],
                retries=3
            )

    t3 = SimpleHttpOperator(
                task_id='request_' + source_type + '_report',
                method='POST',
                http_conn_id='abc',
                endpoint=endpoint,
                data=json.dumps({
                    "query": {
                        "start": "{{ task_instance.xcom_pull(task_ids='prev_task_id') }}",
                        "stop": str(yesterday),
                        "fields": [
                            1
                        ]
                    }
                }),
                headers={"Content-Type": "application/json", "Authorization": 'abc'},
                response_check=lambda response: True if len(response.json()) == 0 else False,
                log_response=True,
                retries=3
            )
Run Code Online (Sandbox Code Playgroud)

查询:我想将 t3 中的上一个任务 ID 传递到其数据变量中。我不知道如何做到这一点,因为 t2 任务 id 不是恒定的。它随着 source_type 的变化而变化。显然,当我尝试时它没有渲染它。

Jos*_*osh 3

我以前没有在任何 DAG 中使用过 Jinja 模板,但我也遇到过类似的问题,我需要从具有动态生成的 task_id 的特定任务中检索 XCOM 值。

您可以按照在 T2 中task_ids定义 的相同方式在 T3 中定义task_id。例如:

source_list = ['account', 'sales']

for source_type in source_list:

    task_id='compute_next_gather_time_for_' + source_type

    t2 = PythonOperator(
                task_id=task_id,
                python_callable=compute_next_gather_time,
                provide_context=True,
                trigger_rule=TriggerRule.ALL_SUCCESS,
                op_args=[source_type],
                retries=3
            )

    t3 = SimpleHttpOperator(
                task_id='request_' + source_type + '_report',
                method='POST',
                http_conn_id='abc',
                endpoint=endpoint,
                data=json.dumps({
                    "query": {
                        "start": "{{ task_instance.xcom_pull(task_ids=task_id) }}",
                        "stop": str(yesterday),
                        "fields": [
                            1
                        ]
                    }
                }),
                headers={"Content-Type": "application/json", "Authorization": 'abc'},
                response_check=lambda response: True if len(response.json()) == 0 else False,
                log_response=True,
                retries=3
            )
Run Code Online (Sandbox Code Playgroud)