Rus*_*sty 23 python directed-acyclic-graphs python-3.x airflow
我是新手Airflow
。我正在学习教程并编写了以下代码。
from airflow import DAG
from airflow.operators.python_operator import PythonOperator
from datetime import datetime, timedelta
from models.correctness_prediction import CorrectnessPrediction
default_args = {
'owner': 'abc',
'depends_on_past': False,
'start_date': datetime.now(),
'email': ['abc@xyz.com'],
'email_on_failure': False,
'email_on_retry': False,
'retries': 1,
'retry_delay': timedelta(minutes=5)
}
def correctness_prediction(arg):
CorrectnessPrediction.train()
dag = DAG('daily_processing', default_args=default_args)
task_1 = PythonOperator(
task_id='print_the_context',
provide_context=True,
python_callable=correctness_prediction,
dag=dag)
Run Code Online (Sandbox Code Playgroud)
在运行脚本时,它不会显示任何错误,但是当我检查它时dags
,Web-UI
它不会显示在Menu -> DAGs 下
但是我可以job
在Menu -> Browse -> Jobs下看到预定的
我也看不到 $AIRFLOW_HOME/dags 中的任何内容。难道只能这样吗?有人可以解释为什么吗?
sam*_*amm 19
运行airflow list_dags
检查dag文件是否定位正确。
出于某种原因,在执行此操作之前,我没有在浏览器 UI 中看到我的 dag。一定是浏览器缓存或其他问题。
如果这不起作用,您应该使用以下命令重新启动网络服务器 airflow webserver -p 8080 -D
Den*_*Ogr 14
我有同样的问题。要解决我需要运行调度程序
airflow scheduler
Run Code Online (Sandbox Code Playgroud)
没有这个命令,我看不到我的新 DAG 顺便说一句:UI 向我显示与该问题相关的警告:
调度程序似乎没有运行。最后一次心跳是在 9 秒前收到的。DAG 列表可能不会更新,并且不会安排新任务。
Pav*_*kyi 11
我们需要澄清几点:
dags_folder
(在 中指定airflow.cfg
。默认情况下,它是$AIRFLOW_HOME/dags
子文件夹)。dags_folder
默认情况下,Airflow Scheduler每 5 分钟检查一次新的 DAG 文件(由dag_dir_list_interval
in 控制airflow.cfg
)。因此,如果您刚刚添加了一个新文件,您有两个选择:
Vin*_*oel 10
在ScheduleJob
你的作业页面上看到的是调度的条目。那不是正在安排的 dag。
你的 $AIRFLOW_HOME/dags 是空的,这很奇怪。所有 dag 必须位于 $AIRFLOW_HOME/dags 目录中(特别是在airflow.cfg
文件中配置的 dags 目录中)。看起来您没有将实际的 dag 存储在正确的目录(dags 目录)中。
或者,有时您还需要重新启动网络服务器才能显示 dag(尽管这似乎不是这里的问题)。
小智 5
检查中的dags_folder
变量 airflow.cfg
。如果您有虚拟环境,export AIRFLOW_HOME=$(pwd)
则从主项目目录运行该命令。请注意,运行export AIRFLOW_HOME=$(pwd)
期望您的 dagdags
位于项目目录的子目录中。
归档时间: |
|
查看次数: |
33420 次 |
最近记录: |