小编shw*_*ill的帖子

气流:日志未显示在 UI 中

当我单击任务然后单击“日志”按钮时,它不显示任何内容

缺少日志的示例

但是,我已经编辑了配置文件以将它们存储在特定的地方。

base_log_folder = /var/log/airflow

并且在 UI 中它特别指出该任务的日志在/var/log/airflow/solr-mentions-cleanups/run-solr-mentions-cleanups-1/2019-02-19T10:46:01.283247+00:00.log,但实际上该日志不存在。

我希望如果我在配置文件中指定了一个路径,那么日志应该就在那里。不确定还有哪些其他可配置的东西。

airflow airflow-scheduler

10
推荐指数
0
解决办法
2233
查看次数

Apache Airflow 任务卡在“up_for_retry”状态

我一直在我们的系统上设置一个气流集群,之前它一直在工作。我不确定我可能做了什么来改变这一点。

我有一个想要按计划运行的 DAG。为了确保它正常工作,我还想手动触发它。目前这些似乎都不起作用,并且似乎没有为任务实例写入日志。唯一可用的日志是气流调度程序日志,它们通常看起来很健康。

我只是不断地收到这条消息:

Task is not ready for retry yet but will be retried automatically. Current date is 2018-12-12T11:34:46.978355+00:00 and task will be retried at 2018-12-12T11:35:08.093313+00:00.

但是,如果我稍等一下,就会再次显示完全相同的消息,只是时间向前移动了一点。因此,该任务似乎从未真正被重试过。

我正在使用 LocalExecutor,任务是 SSHOperator。简化代码如下。它所做的只是将 ssh 连接到另一台机器上,并使用预先确定的目录结构启动一堆应用程序。:

DB_INFO_FILE = 'info.json'
START_SCRIPT = '/bin/start.sh'
TIME_IN_PAST = timezone.convert_to_utc(datetime.today() - 
timedelta(days=1))

DEFAULT_ARGS = {
    'owner': 'airflow',
    'depends_on_past': False,
    'start_date': TIME_IN_PAST,
    'email': ['some_email@blah.com'],
    'email_on_failure': False,
    'email_on_retry': False,
    'retries': 1,
    'retry_delay': timedelta(minutes=1),
}

def _extract_instance_id(instance_string):
    return re.findall(r'\d+', instance_string)[0]

def _read_file_as_json(file_name):
    with open(file_name) as open_file:
         return json.load(open_file)

DB_INFO = _read_file_as_json(DB_INFO_FILE) …
Run Code Online (Sandbox Code Playgroud)

airflow

5
推荐指数
1
解决办法
1万
查看次数

气流运行失败,但气流测试有效。不知道为什么

因此,在提出这个问题之前,我浏览了文档并查看了Airflow 中“气流运行”和“气流测试”之间的差异,看看我是否能找出为什么会出现这个问题。

我有一些 dags,它们都使用LocalExecutor. 其中两个使用 an SSHOperator,另一个仅在本地运行。我已经尝试过了airflow run <some_task_id> <some_execution_date>airflow trigger_dag <dag_id>但都失败了。但是,当我运行时airflow test <task_id> <execution_date>它有效。我应该强调的是,对于仅具有本地运行任务的 dag 来说也是如此。

start_date围绕in dags 以及它与 的关系似乎存在很多混乱schedule_interval。我所有的 dags 都有一个静态 start_date 设置为最近的时间,为了理智起见,我有计划间隔,schedule_interval='* * * * *'以便它每分钟运行一次(这是一个轻量级任务)。当运行 dag 时,如果重试次数设置为 0,则任务只会运行并失败,或者如果重试次数> 0,则任务会陷入重试状态,每分钟都没有太多反馈。对于每种情况,我得到的任务实例详细信息是:

Task instance's dagrun did not exist: Unknown reason.

或者

Task is not ready for retry yet but will be retried automatically. Current date is 2019-02-20T12:30:35.381668+00:00 and task will be retried at …

airflow airflow-scheduler

5
推荐指数
0
解决办法
1103
查看次数

标签 统计

airflow ×3

airflow-scheduler ×2