小编Abh*_*tra的帖子

气流中的Python脚本调度

嗨,大家好,

我需要使用airflow来安排我的python 文件(其中包含从sql和一些连接中提取数据).我已经成功地将气流安装到我的linux服务器中,我可以使用气流网络服务器.但即使在完成文档后,我也不清楚我需要在哪里编写脚本以进行调度以及该脚本如何在airflow webserver中可用,这样我才能看到状态

就配置而言,我知道dag文件夹在我的主目录中的位置以及示例dags所在的位置.

注意:请不要将此标记为重复与如何在Airflow中运行bash脚本文件,因为我需要运行位于不同位置的python文件.

请在Airflow网络服务器中找到以下配置:

在此输入图像描述

下面是AIRFLOW_HOME目录中dag文件夹的屏幕截图

在此输入图像描述

还可以在下面找到DAG创建屏幕截图和Missing DAG错误的屏幕截图

在此输入图像描述

在此输入图像描述

在我选择简单的 DAG之后,填充了丢失DAG的错误

在此输入图像描述

python scheduling reload apache-spark airflow

11
推荐指数
2
解决办法
2万
查看次数

架构StructType中的Integertype()

我正在尝试定义一种架构,以按照以下语法将空白列表转换为数据框:

data=[]

schema = StructType([
StructField("Table_Flag",StringType(),True),
StructField("TableID",IntegerType(),False),
StructField("Entry_No",StringType(),True),
StructField("Dimension_Code",StringType(),True),
StructField("Dimension_Value_Code",StringType(),True)
])

data=spark.createDataFrame(data,schema)
Run Code Online (Sandbox Code Playgroud)

但它给出了错误名称'IntegerType'的定义。我已经尝试过使用BooleanType,DecimalType,FloatType,IntegralType,但是都无法正常工作。只有StringType和DataType可用作数据类型。根据文档类型,在示例中定义了py IntegerType。

请提出建议。我正在使用Spark版本2.0.1

schema struct dataframe apache-spark pyspark

1
推荐指数
1
解决办法
4599
查看次数