当我单击任务然后单击“日志”按钮时,它不显示任何内容
但是,我已经编辑了配置文件以将它们存储在特定的地方。
base_log_folder = /var/log/airflow
并且在 UI 中它特别指出该任务的日志在/var/log/airflow/solr-mentions-cleanups/run-solr-mentions-cleanups-1/2019-02-19T10:46:01.283247+00:00.log,但实际上该日志不存在。
我希望如果我在配置文件中指定了一个路径,那么日志应该就在那里。不确定还有哪些其他可配置的东西。
我一直在我们的系统上设置一个气流集群,之前它一直在工作。我不确定我可能做了什么来改变这一点。
我有一个想要按计划运行的 DAG。为了确保它正常工作,我还想手动触发它。目前这些似乎都不起作用,并且似乎没有为任务实例写入日志。唯一可用的日志是气流调度程序日志,它们通常看起来很健康。
我只是不断地收到这条消息:
Task is not ready for retry yet but will be retried automatically. Current date is 2018-12-12T11:34:46.978355+00:00 and task will be retried at 2018-12-12T11:35:08.093313+00:00.
但是,如果我稍等一下,就会再次显示完全相同的消息,只是时间向前移动了一点。因此,该任务似乎从未真正被重试过。
我正在使用 LocalExecutor,任务是 SSHOperator。简化代码如下。它所做的只是将 ssh 连接到另一台机器上,并使用预先确定的目录结构启动一堆应用程序。:
DB_INFO_FILE = 'info.json'
START_SCRIPT = '/bin/start.sh'
TIME_IN_PAST = timezone.convert_to_utc(datetime.today() -
timedelta(days=1))
DEFAULT_ARGS = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': TIME_IN_PAST,
'email': ['some_email@blah.com'],
'email_on_failure': False,
'email_on_retry': False,
'retries': 1,
'retry_delay': timedelta(minutes=1),
}
def _extract_instance_id(instance_string):
return re.findall(r'\d+', instance_string)[0]
def _read_file_as_json(file_name):
with open(file_name) as open_file:
return json.load(open_file)
DB_INFO = _read_file_as_json(DB_INFO_FILE) …Run Code Online (Sandbox Code Playgroud) 因此,在提出这个问题之前,我浏览了文档并查看了Airflow 中“气流运行”和“气流测试”之间的差异,看看我是否能找出为什么会出现这个问题。
我有一些 dags,它们都使用LocalExecutor. 其中两个使用 an SSHOperator,另一个仅在本地运行。我已经尝试过了airflow run <some_task_id> <some_execution_date>,airflow trigger_dag <dag_id>但都失败了。但是,当我运行时airflow test <task_id> <execution_date>它有效。我应该强调的是,对于仅具有本地运行任务的 dag 来说也是如此。
start_date围绕in dags 以及它与 的关系似乎存在很多混乱schedule_interval。我所有的 dags 都有一个静态 start_date 设置为最近的时间,为了理智起见,我有计划间隔,schedule_interval='* * * * *'以便它每分钟运行一次(这是一个轻量级任务)。当运行 dag 时,如果重试次数设置为 0,则任务只会运行并失败,或者如果重试次数> 0,则任务会陷入重试状态,每分钟都没有太多反馈。对于每种情况,我得到的任务实例详细信息是:
Task instance's dagrun did not exist: Unknown reason.
或者
Task is not ready for retry yet but will be retried automatically. Current date is 2019-02-20T12:30:35.381668+00:00 and task will be retried at …