小编I.C*_*rfi的帖子

空状态的气流任务

在 EC2 上的 24xlarge 机器上运行时,我遇到了气流问题。

我必须注意并行级别是 256。

有几天,由于两个未确定的原因,dagrun 以“失败”状态结束:

  1. 某些任务的状态为“upstream_failed”,这是不正确的,因为我们可以清楚地看到前面的所有步骤都成功了。 在此处输入图片说明

  2. 其他任务的状态不是“空”,它们还没有开始,它们会导致 dagrun 失败。 在此处输入图片说明

我必须注意这两个任务的日志都是空的

在此处输入图片说明

以下是这些案例的 tast 实例详细信息:

在此处输入图片说明

请问有什么解决办法吗?

python amazon-s3 airflow airflow-scheduler

6
推荐指数
1
解决办法
5322
查看次数

Azure Data Lake Storage x Azure Blob存储和Azure文件存储之间的区别

我对不同的Azure存储服务的用例有疑问:

  • Azure数据湖存储。
  • Azure Blob存储。
  • Azure文件存储。

这些服务有什么区别?以及何时使用它们,因为它们都在Azure的云平台上提供了相同的功能(存储)。

cloud azure azure-storage-blobs azure-data-lake

5
推荐指数
1
解决办法
2972
查看次数

Databricks:装载和直接访问 Data Lake Storage Gen 2 之间的区别

使用服务主体和使用 SAS 密钥直接访问在 Databricks 上安装 Azure Data Lake Store Gen2 有什么区别?

我想知道数据传输、访问安全方面的区别

谢谢

azure apache-spark databricks azure-databricks

5
推荐指数
1
解决办法
623
查看次数

任务之间的气流延迟

正如您在图像中看到的那样: 任务之间的DAG延迟]气流在任务执行之间造成太多时间?它几乎占DAG执行时间的30%.我已将airflow.cfg文件更改为:

job_heartbeat_sec = 1 
scheduler_heartbeat_sec = 1
Run Code Online (Sandbox Code Playgroud)

但我仍然有相同的延迟率.

为什么它会这样?

python directed-acyclic-graphs airflow airflow-scheduler

4
推荐指数
2
解决办法
1523
查看次数